Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Tìm hiểu cách mô hình YOLO11 mới của Ultralytics cải thiện khả năng phân loại hình ảnh, mang lại độ chính xác cao hơn cho các tác vụ trong nông nghiệp, bán lẻ và giám sát động vật hoang dã.
Trong bài viết này, chúng ta sẽ khám phá những điều cơ bản về phân loại hình ảnh , thảo luận về các ứng dụng trong thế giới thực và chỉ cho bạn cách sử dụng YOLO11 để phân loại hình ảnh thông qua gói Ultralytics Python . Chúng ta cũng sẽ xem xét cách bạn có thể dùng thử các khả năng của YOLO11 trên Ultralytics HUB trong một vài bước đơn giản. Hãy bắt đầu nào!
Hình 1. Ví dụ về việc sử dụng Ultralytics YOLO11 để phân loại mèo Ba Tư.
Phân loại hình ảnh là gì?
Phân loại hình ảnh hoạt động bằng cách gán nhãn hoặc thẻ cho hình ảnh dựa trên các mẫu học được từ hình ảnh được gắn nhãn trước đó. Bằng cách phân tích cẩn thận các điểm ảnh của hình ảnh, mô hình thị giác máy tính có thể tìm ra sự phù hợp nhất cho hình ảnh. Các mô hình đáng tin cậy như YOLO11 có thể xử lý quá trình này một cách liền mạch. Kiến trúc mô hình của YOLO11 giúp xử lý hình ảnh hoặc khung video gần như ngay lập tức, khiến nó trở nên lý tưởng cho các ứng dụng cần phân loại hình ảnh nhanh chóng và chính xác.
Để thực sự hiểu phạm vi phân loại hình ảnh, cần phân biệt nó với các nhiệm vụ khác như phát hiện đối tượng . Trong khi phân loại hình ảnh gắn nhãn toàn bộ hình ảnh, phát hiện đối tượng xác định và định vị từng đối tượng trong hình ảnh.
Hình 2. So sánh phân loại hình ảnh, phát hiện đối tượng và phân đoạn hình ảnh.
Hãy xem xét hình ảnh một con hươu cao cổ. Trong phân loại hình ảnh , mô hình có thể dán nhãn toàn bộ hình ảnh chỉ là một con hươu cao cổ dựa trên nội dung tổng thể của nó. Tuy nhiên, với phát hiện đối tượng , mô hình không dừng lại ở việc xác định con hươu cao cổ; nó cũng đặt một hộp giới hạn xung quanh con hươu cao cổ, xác định vị trí chính xác của nó trong hình ảnh.
Bây giờ, hãy tưởng tượng con hươu cao cổ đứng gần một cái cây trong thảo nguyên với các loài động vật khác. Một mô hình phân loại hình ảnh có thể dán nhãn toàn bộ cảnh là thảo nguyên hoặc chỉ là động vật hoang dã. Tuy nhiên, với phát hiện đối tượng, mô hình sẽ xác định từng yếu tố riêng lẻ, nhận dạng con hươu cao cổ, cây và các loài động vật khác, mỗi loài có hộp giới hạn riêng.
Ứng dụng phân loại hình ảnh YOLO11
Độ chính xác và hiệu suất của mô hình YOLO11 Ultralytics để phân loại hình ảnh khiến nó hữu ích trong nhiều ngành công nghiệp. Hãy cùng khám phá một số ứng dụng chính của YOLO11 trong phân loại hình ảnh.
Phân loại hình ảnh YOLO11 trong nông nghiệp
Phân loại hình ảnh có thể giúp hợp lý hóa nhiều chức năng trong ngành nông nghiệp và chăn nuôi. Cụ thể, sử dụng các mô hình phân loại hình ảnh như YOLO11, nông dân có thể liên tục theo dõi sức khỏe cây trồng , phát hiện các bệnh nghiêm trọng và xác định bất kỳ sự xâm nhập của sâu bệnh nào với độ chính xác cao.
Xử lý : Tùy thuộc vào tài nguyên và khả năng kết nối có sẵn, hình ảnh có thể được xử lý tại chỗ thông qua điện toán biên hoặc tải lên đám mây để phân tích chuyên sâu hơn.
Phân loại hình ảnh với YOLO11 : Mô hình YOLO11 có thể phân tích những hình ảnh này để phân loại các điều kiện cây trồng khác nhau. Các lớp phổ biến có thể bao gồm khỏe mạnh, bị bệnh, bị sâu bệnh hoặc thiếu chất dinh dưỡng, giúp xác định chính xác các vấn đề cụ thể ảnh hưởng đến các khu vực khác nhau của cánh đồng.
Tạo thông tin chuyên sâu : Dựa trên phân loại, YOLO11 cung cấp thông tin chuyên sâu về các chỉ số sức khỏe cây trồng, giúp nông dân phát hiện sớm các dấu hiệu bệnh tật, xác định ổ dịch hại hoặc phát hiện tình trạng thiếu hụt chất dinh dưỡng .
Ra quyết định sáng suốt : Với những hiểu biết này, nông dân có thể đưa ra quyết định có mục tiêu về tưới tiêu, bón phân và kiểm soát sâu bệnh, chỉ sử dụng nguồn lực ở nơi cần thiết nhất.
Hình 3. Một ví dụ về các loại lá khác nhau từ lá khỏe mạnh đến lá bị nhiễm bệnh.
Phân loại hình ảnh YOLO11 trong bán lẻ
Phân loại hình ảnh có thể cải thiện đáng kể trải nghiệm mua sắm bán lẻ , giúp trải nghiệm này trở nên cá nhân hóa và thân thiện hơn với người dùng. Các nhà bán lẻ có thể sử dụng các mô hình thị giác máy tính được đào tạo tùy chỉnh để nhận dạng sản phẩm trong kho của họ và tích hợp khả năng này vào ứng dụng di động hoặc trang web của họ. Sau đó, khách hàng có thể tìm kiếm sản phẩm chỉ bằng cách tải ảnh lên, giúp việc mua sắm nhanh hơn và thuận tiện hơn.
Khi khách hàng tải hình ảnh lên hệ thống tìm kiếm trực quan, có một số bước diễn ra ở hậu trường trước khi kết quả tìm kiếm hiển thị.
Đầu tiên, phát hiện đối tượng có thể được sử dụng để chọn ra các mục chính trong hình ảnh, như xác định một mảnh quần áo hoặc một món đồ nội thất và tách nó ra khỏi nền. Tiếp theo, phân loại hình ảnh có thể được sử dụng để phân loại thêm từng mục, nhận dạng xem đó là áo khoác, áo sơ mi, ghế sofa hay bàn.
Với thông tin này, hệ thống có thể đưa ra các sản phẩm tương tự có sẵn để mua, đặc biệt hữu ích khi tìm các mặt hàng độc đáo hoặc hợp thời trang khó có thể mô tả bằng lời. Công nghệ tương tự cũng có thể giúp hợp lý hóa các tác vụ bán lẻ khác, như quản lý hàng tồn kho , bằng cách tự động nhận dạng và phân loại các mặt hàng.
Hình 4. Nền tảng tìm kiếm trực quan dựa trên phân loại hình ảnh đang hoạt động.
Giám sát động vật hoang dã với phân loại hình ảnh YOLO11
Theo truyền thống, việc theo dõi động vật trong tự nhiên là một nhiệm vụ tẻ nhạt liên quan đến nhiều người phân loại và phân tích thủ công hàng nghìn bức ảnh. Với các chế độ thị giác máy tính như YOLO11, các nhà nghiên cứu có thể tự động theo dõi động vật với tốc độ nhanh hơn. Máy ảnh có thể được đặt trong môi trường sống tự nhiên để chụp ảnh. Sau đó, mô hình AI thị giác có thể được sử dụng để phân tích những bức ảnh này và phân loại các loài động vật trong đó (nếu có). Một hệ thống như vậy có thể giúp các nhà nghiên cứu nghiên cứu và theo dõi quần thể động vật, mô hình di cư của chúng, v.v.
Một cách khác mà AI và các mô hình thị giác máy tính như YOLO11 có thể giúp ích trong lĩnh vực này là hợp lý hóa quy trình phân loại các loài có nguy cơ tuyệt chủng. Bằng cách xác định các loài tiềm năng hoặc các loại giống mà một loài động vật có thể thuộc về, các mô hình này có thể cung cấp dữ liệu cần thiết cho các nhà nghiên cứu. Ví dụ, Đại học Tasmania (UTAS) đã phát triển một hệ thống dựa trên phân loại hình ảnh để theo dõi các loài động vật hoang dã khác nhau ở Tasmania . Các dự đoán từ các mô hình sau đó có thể giúp các nhà khoa học và nhà nghiên cứu theo dõi hoạt động và hành vi của động vật, có thể báo hiệu các mối đe dọa như săn trộm hoặc mất môi trường sống .
Hình 5. YOLO11 dự đoán các giống chó có thể thuộc về.
Thử nghiệm phân loại hình ảnh với mô hình YOLO11
Bây giờ chúng ta đã thảo luận về phân loại hình ảnh là gì và khám phá một số ứng dụng của nó. Hãy cùng xem cách bạn có thể thử phân loại hình ảnh với mô hình YOLO11 mới. Có hai cách dễ dàng để bắt đầu: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB . Chúng ta sẽ hướng dẫn cả hai tùy chọn.
Sau khi cài đặt gói, bạn có thể sử dụng mã sau để tải một biến thể của mô hình phân loại hình ảnh YOLO11 và chạy suy luận trên một hình ảnh. Chạy suy luận có nghĩa là sử dụng một mô hình đã được đào tạo để đưa ra dự đoán về dữ liệu mới, chưa từng thấy. Bạn có thể thử với một hình ảnh tùy chọn!
Hình 6. Chạy suy luận bằng Mô hình YOLO11.
Đào tạo mô hình phân loại YOLO11 tùy chỉnh
Bạn cũng có thể sử dụng cùng một gói Python để đào tạo mô hình phân loại YOLO11 tùy chỉnh. Đào tạo tùy chỉnh giúp bạn có thể tinh chỉnh mô hình YOLO11 cho nhu cầu cụ thể của mình. Ví dụ, nếu bạn đang phát triển ứng dụng để phân loại các giống mèo khác nhau, bạn có thể đào tạo tùy chỉnh mô hình YOLO11 chỉ cho mục đích đó.
Mã bên dưới cho thấy cách tải và đào tạo mô hình phân loại hình ảnh YOLO11. Nó cho phép bạn chuyển các trọng số được đào tạo trước , sử dụng kiến thức từ một mô hình hiện có để tăng hiệu suất của mô hình của riêng bạn. Bạn có thể chỉ định một tập dữ liệu , như tập dữ liệu "fashion-mnist", là một tập hợp các hình ảnh thang độ xám nổi tiếng về các mặt hàng quần áo (áo sơ mi, quần, giày dép, v.v.). Đào tạo mô hình trên tập dữ liệu này sẽ dạy nó cách nhận dạng các loại quần áo khác nhau. Bạn có thể hoán đổi "fashion-mnist" cho bất kỳ tập dữ liệu nào phù hợp với dự án của mình, chẳng hạn như giống mèo hoặc loại cây.
Hình 7. Đào tạo tùy chỉnh mô hình YOLO11 để phân loại hình ảnh.
Hãy thử YOLO11 trên Ultralytics HUB
Mặc dù sử dụng gói Ultralytics rất đơn giản, nhưng nó đòi hỏi một số kiến thức về Python. Nếu bạn đang tìm kiếm một tùy chọn thân thiện hơn với người mới bắt đầu, bạn có thể sử dụng Ultralytics HUB, một nền tảng được thiết kế để giúp việc đào tạo và triển khai các mô hình YOLO khác nhau trở nên đơn giản và dễ tiếp cận. Để bắt đầu, bạn sẽ cần tạo một tài khoản .
Sau khi đăng nhập, hãy điều hướng đến phần 'Models' và chọn model YOLO11 để phân loại hình ảnh. Bạn sẽ thấy một loạt các kích thước model có sẵn: nano, small, medium, large và extra-large. Sau khi chọn một model, bạn có thể tải hình ảnh lên trong phần 'Preview', nơi các dự đoán sẽ xuất hiện ở phía bên trái của trang sau khi hình ảnh được xử lý.
Hình 8. Sử dụng Ultralytics HUB để chạy suy luận.
Những điểm chính
YOLO11 cung cấp khả năng phân loại hình ảnh mạnh mẽ mở ra những khả năng mới trong nhiều ngành công nghiệp khác nhau. Từ việc cải thiện việc giám sát cây trồng trong nông nghiệp và tăng cường tìm kiếm sản phẩm trong bán lẻ cho đến hỗ trợ bảo tồn động vật hoang dã, tốc độ và độ chính xác của YOLO11 khiến nó trở nên lý tưởng cho nhiều ứng dụng khác nhau. Với các tùy chọn đào tạo tùy chỉnh thông qua gói Ultralytics Python hoặc thiết lập thân thiện với người dùng, không cần mã trên Ultralytics HUB, người dùng có thể dễ dàng kết hợp YOLO11 vào quy trình làm việc của họ. Khi ngày càng nhiều ngành công nghiệp áp dụng các giải pháp AI, YOLO11 cung cấp một công cụ linh hoạt, hiệu suất cao hỗ trợ đổi mới và tiến bộ thực tế.