Devinez la langue maternelle de l'écrivain

Franck Dernoncourt

2014-07-28 08:24:50 UTC

view on stackexchange narkive permalink

Je recherche une bibliothèque ou un programme qui, lorsqu'on lui donne un texte écrit en anglais, essaie de deviner la langue maternelle de l'écrivain (par exemple en se basant sur les erreurs habituelles, les phrases, etc.): idéalement, cela donnerait la probabilité pour chaque langue (par exemple 0,8 espagnol, 0,3 français, 0,2 italien, etc.). Si possible, gratuit, open source et fonctionne avec Windows 7 SP1 x64 Ultimate ou Ubuntu.

Cela ressemble plus à une idée de recherche informatique-linguistique, qu'à un logiciel. Vous pouvez utiliser des méthodes statistiques s'il y a suffisamment de textes de formation disponibles - comme des milliers de pages par personne et des centaines de personnes par langue. Bien sûr, c'est une ** bonne ** idée de recherche informatique-linguistique!