La reconnaissance vocale est intégrée dans presque tous les aspects de la vie moderne, mais il reste un grand écart : les locuteurs de langues minoritaires et ceux avec des accents épais ou des troubles de la parole comme le bégaiement sont généralement moins capables d'utiliser des outils de reconnaissance vocale pour contrôler des applications, transcrire ou automatiser des tâches, entre autres fonctions.
Tobi Olatunji, fondateur et PDG de la startup de reconnaissance vocale clinique Intron Health, veut combler ce fossé. Il affirme qu'Intron est la plus grande base de données vocales cliniques de l'Afrique, son algorithme étant entraîné sur 3,5 millions de clips audio (16 000 heures) provenant de plus de 18 000 contributeurs, principalement des professionnels de la santé, représentant 29 pays et 288 accents. Olatunji déclare que le fait que la majorité de ses contributeurs proviennent du secteur de la santé garantit que les termes médicaux sont prononcés et capturés correctement pour ses marchés cibles.
\"Parce que nous nous sommes déjà entraînés sur de nombreux accents africains, il est très probable que les performances de base de leur accès soient bien meilleures que tout autre service qu'ils utilisent\", a-t-il déclaré, ajoutant que les données du Ghana, de l'Ouganda et de l'Afrique du Sud sont en augmentation et que la startup est confiante dans le déploiement du modèle là-bas.
L'intérêt d'Olatunji pour la technologie médicale découle de deux aspects de son expérience. D'abord, il a été formé et a pratiqué en tant que médecin au Nigéria, où il a vu de première main les ré inefficacités des systèmes sur ce marché, y compris le volume de paperasse à remplir et la difficulté de tout suivre.
Ces questions l'ont poussé à la phase suivante de sa vie. Olatunji a déménagé aux États-Unis pour poursuivre un master en informatique médicale à l'Université de San Francisco puis un autre en informatique à l'Université de technologie de Géorgie.
Il a ensuite fait ses preuves dans plusieurs entreprises technologiques. En tant que scientifique et chercheur en programmation de langage naturel clinique chez Enlitic, une société de la région de la baie de San Francisco, il a élaboré des modèles pour automatiser l'extraction d'informations à partir de rapports de texte en radiologie. Il a également travaillé chez Amazon Web Services en tant que scientifique en apprentissage machine. Chez Enlitic et Amazon, il s'est concentré sur le traitement du langage naturel pour la santé, façonnant des systèmes qui permettent aux hôpitaux de fonctionner mieux.
Tout au long de ces expériences, il a commencé à se former des idées sur la manière dont ce qui était développé et utilisé aux États-Unis pouvait être utilisé pour améliorer les soins de santé au Nigéria et dans d'autres marchés émergents similaires.
L'objectif initial d'Intron Health, lancé en 2020, était de numériser les opérations hospitalières en Afrique à travers un système d'enregistrement médical électronique (EMR). Mais l'adoption a été difficile : Il s'est avéré que les médecins préféraient écrire plutôt que taper, a déclaré Olatunji.
Cela l'a amené à explorer comment améliorer ce problème plus fondamental : comment rendre le travail de saisie de données de base des médecins, l'écriture, plus efficace. Au départ, la société a examiné des solutions tierces pour automatiser des tâches telles que la prise de notes et intégrer des technologies de conversion de la parole en texte existantes dans son programme EMR.
Cependant, il y a eu de nombreux problèmes en raison de la transcriptions constantes incorrectes. Il est devenu évident pour Olatunji que les accents africains épais et la prononciation des termes médicaux compliqués rendaient impraticable l'adoption des outils de transcription étrangers existants.