","image":"http://www.luping.net/uploads/20240913/172621836966e40081c4aae.jpg","datePublished":"2024-09-13T17:06:09+08:00","dateModified":"2024-09-13T17:06:09+08:00","author":{"@type":"Person","name":"luping.net","url":"https://www.luping.net/articlelist/0_1.html"}}
"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > Comparación de bibliotecas de detección de idiomas (y API) utilizando Java/ColdFusion/CFML

Comparación de bibliotecas de detección de idiomas (y API) utilizando Java/ColdFusion/CFML

Publicado el 2024-09-13
Navegar:367

Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML

La detección de idioma es una característica que necesitábamos en un proyecto anterior. Escribí un artículo en 2020 sobre el uso de la bifurcación kju2 de la biblioteca java Optimaize Language Detector. La biblioteca Optimaize no se ha actualizado desde 2015 y la bifurcación kju2 se colocó en modo de solo lectura el 16 de abril de 2023.

Evaluaré la biblioteca Java de Lingua. Afirma ser "la biblioteca de detección de lenguaje natural más precisa para Java y JVM, adecuada tanto para texto largo como corto" y también parece estar activamente actualizada y respaldada. En mi prueba de unidad pequeña, Lingua parecía ser un poco más lenta y no podía identificar correctamente el texto en malayo.

El tiempo de detección para ambas bibliotecas de Java fue bastante aleatorio para el inglés. A veces devolvería una respuesta en 295 ms y otras veces sería 48.000 ms. (Tal vez sea solo mi PC de desarrollador). kju2 parecía ser más rápido en promedio.

También encontré una API de detección de idioma de terceros que admite 165 idiomas y afirma tener "alta precisión". Requiere una clave API y ofrece planes gratuitos y premium.

Si estás realizando la detección de idioma con Java y/o ColdFusion/CFML, ¿qué estás usando?

Debería ser kju2 idioma kju2 ms idioma lengua ms idioma API api ms Texto de muestra
INGLÉS INGLÉS 2272 INGLÉS 570 es 537 Una excelente manera de aprender vocabulario en español es leyendo textos, cuentos o artículos que estén completamente en el idioma. Es por eso que hemos escrito nuestros propios pasajes cortos de lectura en español sobre diferentes temas.
GRIEGO GRIEGO 6 GRIEGO 12 el 105 Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.
FRANCÉS FRANCÉS 61 FRANCÉS 78 fr 70 En invierno, il fait froid en France. Le soleil se lève tard. Il fait encore nuit quand je vais au travail. Parfois, il y a même de la neige.
HEBREO HEBREO 3 HEBREO 11 yo 110 כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם ארץ, נצר מטעי מעשה ידי להתפאר.
ÁRABE ÁRABE 2 ÁRABE 19 Arkansas 81 عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود
CHINO CHINO 2 CHINO 8 zh 74 虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水冲垮了,无家可归。丑丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃。不仅如此,谁头痛、生病了,没钱买药,它都会尽其所能进行帮助。
COREANO COREANO 12 COREANO 3 ko 120 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다.
ESPAÑOL ESPAÑOL 0 ESPAÑOL 116 es 92 Habitualmente este término se aplica a todas las pistas donde aterrizan aviones, sin embargo el término correcto es aeródromo.
TAILANDÉS TAILANDÉS 1 TAILANDÉS 14 ésima 105 1 año าคกันในเกียรติศักด[เกียรติศักดิ์]และสิทธิ ต Más ้วยเจตนารมณ์แห่งภราดรภาพ
VIETNAMITA VIETNAMITA 2 VIETNAMITA 14 vi 98 Tất cả mọi người sinh ra đều được tự do y bình đẳng về nhân phẩm y quyền lợi. Mọi con người đều được tạo hóa ban cho lý trí và lương tâm y cần phải đối xử với nhau trong tình anh em.
TURCO TURCO 3 TURCO 93 tr 212 Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında insan oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. El autor de la pregunta sevk edip dört taraftaki kavmi hep (itaati altına) almış hep muti kılmış. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş.
JAPONÉS JAPONÉS 3 JAPONÉS 7 ja 194 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんに入はいることができ、私わたしはまた働はたらき始はじめた。
RUSO RUSO 2 RUSO 1393 ru 96 Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства.
FINLANDÉS FINLANDÉS 6 FINLANDÉS 383 fi 125 Jokaisella on oikeus saada opetusta. Opetuksen on oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen en oltava pakollinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, ja korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan.
URDU URDU 1 URDU 22 ur 104 ایک ملک پر سخت گیر بادشاہ حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹی کس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔
TAILANDÉS TAILANDÉS 1 TAILANDÉS 2 ésima 78 Hola mundo สวัสดีชาวโลก
MALAYO MALAYO 2 DESCONOCIDO 291 identificación 88 Pesan moral dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terlalu tamak dan serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal dengan perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan.

Código fuente

https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25

Declaración de liberación Este artículo se reproduce en: https://dev.to/gamesover/comparing-language-detection-libraries-api-using-javacoldfusioncfml-gkf?1 Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3