","image":"http://www.luping.net/uploads/20240913/172621836966e40081c4aae.jpg","datePublished":"2024-11-08T03:34:27+08:00","dateModified":"2024-11-08T03:34:27+08:00","author":{"@type":"Person","name":"luping.net","url":"https://www.luping.net/articlelist/0_1.html"}}
"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Comparando bibliotecas de detecção de linguagem (e API) usando Java/ColdFusion/CFML

Comparando bibliotecas de detecção de linguagem (e API) usando Java/ColdFusion/CFML

Publicado em 2024-11-08
Navegar:506

Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML

A detecção de idioma é um recurso que precisávamos em um projeto anterior. Escrevi um artigo em 2020 sobre o uso do fork kju2 da biblioteca java Optimaize Language Detector. A biblioteca Optimaize não é atualizada desde 2015 e o fork kju2 foi colocado no modo somente leitura em 16 de abril de 2023.

Avaliei a biblioteca Java do Lingua. Ela afirma ser a "biblioteca de detecção de linguagem natural mais precisa para Java e JVM, adequada para textos longos e curtos" e também parece ser ativamente atualizada e suportada. Em meu pequeno teste de unidade, o Lingua parecia um pouco mais lento e não conseguiu identificar corretamente o texto em malaio.

O tempo de detecção para ambas as bibliotecas java foi bastante aleatório para o inglês. Às vezes, ele retornava uma resposta em 295 ms e outras vezes em 48.000 ms. (Talvez seja apenas meu PC de desenvolvedor.) kju2 parecia ser mais rápido em média.

Também encontrei uma API Detect Language de terceiros que oferece suporte a 165 idiomas e afirma ter "alta precisão". Requer uma chave de API e oferece planos gratuitos e premium.

Se você estiver realizando detecção de linguagem com Java e/ou ColdFusion/CFML, o que você está usando?

Deveria ser kju2 lang kju2 ms idioma idioma linguagem MS API Lang api ms Texto de exemplo
INGLÊS INGLÊS 2272 INGLÊS 570 pt 537 Uma ótima maneira de aprender vocabulário em espanhol é lendo textos, histórias ou artigos totalmente no idioma. É por isso que escrevemos pequenas passagens de leitura em espanhol sobre diferentes temas.
GREGO GREGO 6 GREGO 12 el 105 Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.
FRANCÊS FRANCÊS 61 FRANCÊS 78 fr 70 En hiver, il fait froid en France. Le soleil se demora. Il fait encore nuit quand je vais au travail. Parfois, ele é o mesmo do neige.
HEBRAICO HEBRAICO 3 HEBRAICO 11 eu 110 כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם ארץ, נצר מטעי מעשה ידי להתפאר.
ÁRABE ÁRABE 2 ÁRABE 19 ar 81 عندما يريد العالم أن يتكلّم, فهو يتحدّث بلغة يونيكود. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود
CHINÊS CHINÊS 2 CHINÊS 8 zh 74 虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水冲垮了,无家可归。丑丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃。不仅如此,谁头痛、生病了,没钱买药,它都会尽其所能进行帮助。
COREANO COREANO 12 COREANO 3 ko 120 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다.
ESPANHOL ESPANHOL 0 ESPANHOL 116 é 92 Habitualmente este termo se aplica a todas as pistas onde os aviões aterrissam, sem embargo o termo correto é o aeródromo.
THAI THAI 1 THAI 14 o 105 ข้อ 1 ano Mais Mais Mais
VIETNAMITA VIETNAMITA 2 VIETNAMITA 14 vi 98 Tất cả mọi người sinh ra đều được tự do e bình đẳng về nhân phẩm e quyền lợi. Mọi con người đều được tạo hóa ban cho lý trí e lương tâm e cần phải đối xử với nhau trong tình anh em.
TURCO TURCO 3 TURCO 93 tr 212 Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında insan oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Asker sevk edip dört taraftaki kavmi hep (itaati altına) almış hep muti kılmış. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş.
JAPONÊS JAPONÊS 3 JAPONÊS 7 194 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんに入はいることができ、私わたしはまた働はたらき始はじめた。
RUSSO RUSSO 2 RUSSO 1393 ru 96 Você pode fazer tudo o que quiser e entregar em sua entrega e entrega. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства.
FINLANDÊS FINLANDÊS 6 FINLANDÊS 383 fi 125 Jokaisella on oikeus saada opetusta. Opetuksen em oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen em oltava pakolinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, e korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan.
URDU URDU 1 URDU 22 nosso 104 حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹیکس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔
THAI THAI 1 THAI 2 o 78 Olá, mundo.
MALAIO MALAIO 2 DESCONHECIDO 291 eu ia 88 Pesan moral de Cerita Rakyat Bawang Merah Bawang Putih é Jangan terlalu tamak e serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal com perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan.

Código Fonte

https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/gamesover/comparing-language-detection-libraries-api-using-javacoldfusioncfml-gkf?1 Se houver alguma violação, entre em contato com [email protected] para excluí-la
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3