Question:
Devinez la langue maternelle de l'écrivain
Franck Dernoncourt
2014-07-28 08:24:50 UTC
view on stackexchange narkive permalink

Je recherche une bibliothèque ou un programme qui, lorsqu'on lui donne un texte écrit en anglais, essaie de deviner la langue maternelle de l'écrivain (par exemple en se basant sur les erreurs habituelles, les phrases, etc.): idéalement, cela donnerait la probabilité pour chaque langue (par exemple 0,8 espagnol, 0,3 français, 0,2 italien, etc.). Si possible, gratuit, open source et fonctionne avec Windows 7 SP1 x64 Ultimate ou Ubuntu.

Cela ressemble plus à une idée de recherche informatique-linguistique, qu'à un logiciel. Vous pouvez utiliser des méthodes statistiques s'il y a suffisamment de textes de formation disponibles - comme des milliers de pages par personne et des centaines de personnes par langue. Bien sûr, c'est une ** bonne ** idée de recherche informatique-linguistique!
Un répondre:
zelandiya
2014-10-06 04:07:14 UTC
view on stackexchange narkive permalink

C'est ce que je sais le plus proche de ce que vous recherchez est un quiz en ligne, pas un programme: http://www.gameswithwords.org/WhichEnglish/

Mais pour ce qui est des logiciels, je recommande d'essayer une bibliothèque de catégorisation de texte supervisée (NLTK en Python, Mallet en Java), formée sur des textes dont vous connaissez la langue maternelle de l'auteur. Je recommande de conserver les mots vides et d'utiliser les n-grammes comme fonctionnalités pour essayer de capturer des caractéristiques spécifiques de la façon dont un locuteur natif parlerait en anglais.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...