Identificação de idioma
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.

Com a API de identificação de idioma no dispositivo do Kit de ML, é possível determinar o
idioma de uma string de texto.
A identificação de idioma pode ser útil ao trabalhar com texto fornecido pelo usuário,
que geralmente não vem com informações de idioma.
iOS
Android
Principais recursos
Amplo suporte a idiomas. Identifica mais de cem idiomas diferentes. Veja a lista completa.
Suporte a texto romanizado. Identifica texto em árabe, búlgaro, grego, hindi, japonês, russo e chinês em script nativo e romanizado.
Resultados de exemplo
Identificação de idioma simples |
"Meu aeronave está cheio de enguias." |
en (inglês) |
"Dao shan xue hai" |
zh-Latn (chinês latinizado) |
"ph'nglui mglw'nafh wgah'nagl fhtagn" |
und (indeterminado) |
Distribuição de confiança |
"um golpe de golpe amigável" |
en (0,52)
fr (0,44)
ca (0,03)
|
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-29 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-29 UTC."],[[["\u003cp\u003eML Kit's language identification API allows you to determine the language of a text string, which is particularly helpful when dealing with user-generated content that often lacks language information.\u003c/p\u003e\n"],["\u003cp\u003eIt supports a wide range of languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese text.\u003c/p\u003e\n"],["\u003cp\u003eThe API can provide a simple language identification or a confidence distribution across multiple languages for a given text.\u003c/p\u003e\n"]]],["ML Kit's on-device API identifies the language of text strings, supporting over one hundred languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese. It's designed for user-provided text that lacks language information. The API outputs language codes (e.g., `en` for English) or `und` for undetermined. For ambiguous cases, it provides a confidence distribution across multiple languages (e.g., `en` (0.52), `fr` (0.44)).\n"],null,["With ML Kit's on-device language identification API, you can determine the\nlanguage of a string of text.\n\nLanguage identification can be useful when working with user-provided text,\nwhich often doesn't come with any language information.\n\n[iOS](/ml-kit/language/identification/ios)\n[Android](/ml-kit/language/identification/android)\n\nKey capabilities\n\n- **Broad language support.** Identifies over one hundred different languages. See the\n [complete list](/ml-kit/language/identification/langid-support).\n\n- **Romanized text support.** Identifies Arabic, Bulgarian, Greek, Hindi, Japanese,\n Russian, and Chinese text in both native and romanized script.\n\nExample results\n\n| Simple language identification ||\n|---------------------------------------|-------------------------------|\n| \"My hovercraft is full of eels.\" | `en` (English) |\n| \"Dao shan xue hai\" | `zh-Latn` (Latinized Chinese) |\n| \"ph'nglui mglw'nafh wgah'nagl fhtagn\" | `und` (undetermined) |\n\n| Confidence distribution ||\n|---------------------------|-------------------------------------|\n| \"an amicable coup d'etat\" | `en` (0.52) `fr` (0.44) `ca` (0.03) |"]]