با مجموعهها، منظم بمانید
ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
API ML Kit Text Recognition v2 می تواند متن را در هر مجموعه حروف چینی، دوانگاری، ژاپنی، کره ای و لاتین تشخیص دهد. همچنین میتوان از API برای خودکارسازی وظایف ورود دادهها مانند پردازش کارتهای اعتباری، رسیدها و کارتهای تجاری استفاده کرد.
تشخیص متن در اسکریپت ها و زبان های مختلف پشتیبانی از تشخیص متن به زبان های چینی، دوانگاری، ژاپنی، کره ای و لاتین
ساختار متن را تجزیه و تحلیل می کند از تشخیص نمادها، عناصر، خطوط و پاراگراف ها پشتیبانی می کند
شناسایی زبان متن زبان متن شناسایی شده را شناسایی می کند
تشخیص زمان واقعی می تواند متن را در زمان واقعی در طیف گسترده ای از دستگاه ها تشخیص دهد
ساختار متن
Text Recognizer متن را به بلوک ها، خطوط، عناصر و نمادها تقسیم می کند. به طور تقریبی:
Block مجموعه ای از خطوط متنی به هم پیوسته است، مانند یک پاراگراف یا ستون،
a Line مجموعه ای از کلمات به هم پیوسته در یک محور است و
یک عنصر مجموعه ای از نویسه های الفبایی عددی ("کلمه") در یک محور در اکثر زبان های لاتین یا یک کلمه در زبان های دیگر است.
نماد یک نویسه الفبایی منفرد در یک محور در اکثر زبان های لاتین یا یک کاراکتر در زبان های دیگر است.
تصویر زیر نمونه هایی از هر یک از این موارد را به ترتیب نزولی نشان می دهد. اولین بلوک برجسته، به رنگ فیروزه ای، یک بلوک متن است. مجموعه دوم بلوک های برجسته، به رنگ آبی، خطوط متن هستند. در نهایت، مجموعه سوم بلوک های برجسته، به رنگ آبی تیره، Words هستند.
برای تمام بلوکها، خطوط، عناصر و نمادهای شناساییشده، API کادرهای محدود، نقاط گوشه، اطلاعات چرخش، امتیاز اطمینان، زبانهای شناسایی شده و متن شناسایی شده را برمیگرداند.
تاریخ آخرین بهروزرسانی 2025-07-24 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2025-07-24 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eThe ML Kit Text Recognition v2 API recognizes text in Chinese, Devanagari, Japanese, Korean, and Latin scripts and can automate data entry for documents like credit cards and receipts.\u003c/p\u003e\n"],["\u003cp\u003eIt analyzes text structure by identifying blocks, lines, elements (words), and symbols, returning bounding boxes, corner points, and confidence scores for each.\u003c/p\u003e\n"],["\u003cp\u003eThe API supports real-time text recognition on various devices and can identify the language of the recognized text.\u003c/p\u003e\n"]]],["The ML Kit Text Recognition v2 API recognizes text in Chinese, Devanagari, Japanese, Korean, and Latin scripts. It analyzes text structure by detecting blocks, lines, elements, and symbols, and identifies the language. The API provides bounding boxes, corner points, rotation, confidence scores, recognized languages, and text for detected text. This API can be used for automating data entry from credit cards, receipts and business cards. It also support real time text recognition.\n"],null,["The ML Kit Text Recognition v2 API can recognize text in any Chinese, Devanagari,\nJapanese, Korean and Latin character set. The API can also be used to automate\ndata-entry tasks such as processing credit cards, receipts, and business cards.\n\n[iOS](/ml-kit/vision/text-recognition/v2/ios)\n[Android](/ml-kit/vision/text-recognition/v2/android)\n\nKey capabilities\n\n- **Recognize text across various scripts and languages** Supports recognizing text in Chinese, Devanagari, Japanese, Korean and Latin scripts\n- **Analyzes structure of text** Supports detection of symbols, elements, lines and paragraphs\n- **Identify language of text** Identifies the language of the recognized text\n- **Real-time recognition** Can recognize text in real-time on a wide range of devices\n\nText structure\n\nThe Text Recognizer segments text into blocks, lines, elements and symbols.\nRoughly speaking:\n\n- a **Block** is a contiguous set of text lines, such as a paragraph or\n column,\n\n- a **Line** is a contiguous set of words on the same axis, and\n\n- an **Element** is a contiguous set of alphanumeric characters (\"word\") on the\n same axis in most Latin languages, or a word in others\n\n- an **Symbol** is a single alphanumeric character on the\n same axis in most Latin languages, or a character in others\n\nThe image below highlights examples of each of these in descending order. The\nfirst highlighted block, in cyan, is a Block of text. The second set of\nhighlighted blocks, in blue, are Lines of text. Finally, the third set of\nhighlighted blocks, in dark blue, are Words.\n\nFor all detected blocks, lines, elements and symbols, the API returns the\nbounding boxes, corner points, rotation information, confidence score,\nrecognized languages and recognized text.\n\nExample results \nPhoto: [Dietmar Rabich](//commons.wikimedia.org/wiki/User:XRay \"User:XRay\"), [Wikimedia Commons](//commons.wikimedia.org/wiki/Main_Page \"Main Page\"), [\"Düsseldorf,\nWege der parlamentarischen Demokratie -- 2015 -- 8123\"](//commons.wikimedia.org/wiki/File:D%C3%BCsseldorf,_Wege_der_parlamentarischen_Demokratie_--_2015_--_8123.jpg), [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/)\n\n| Recognized Text ||\n|--------|---------------------------------------|\n| Text | Wege der parlamentarischen Demokratie |\n| Blocks | (1 block) |\n\n| Block 0 ||\n|--------------------------|------------------------------------------------|\n| Text | Wege der parlamentarischen Demokratie |\n| Frame | (296, 665 - 796, 882) |\n| Corner Points | (296, 719), (778, 665), (796, 828), (314, 882) |\n| Recognized Language Code | de |\n| Lines | (3 lines) |\n\n| Line 0 ||\n|--------------------------|------------------------------------------------|\n| Text | Wege der |\n| Frame | (434, 678 - 670, 749) |\n| Corner Points | (434, 705), (665, 678), (670, 722), (439, 749) |\n| Recognized Language Code | de |\n| Confidence Score | 0.8766741 |\n| Rotation Degree | -6.6116457 |\n| Elements | (2 elements) |\n\n| Element 0 ||\n|--------------------------|------------------------------------------------|\n| Text | Wege |\n| Frame | (434, 689 - 575, 749) |\n| Corner Points | (434, 705), (570, 689), (575, 733), (439, 749) |\n| Recognized Language Code | de |\n| Confidence Score | 0.8964844 |\n| Rotation Degree | -6.6116457 |\n| Elements | (4 elements) |\n\n| Symbol 0 ||\n|------------------|------------------------------------------------|\n| Text | W |\n| Frame | (434, 698 - 500, 749) |\n| Corner Points | (434, 706), (495, 698), (500, 741), (439, 749) |\n| Confidence Score | 0.87109375 |\n| Rotation Degree | -6.611646 |"]]