Tìm hiểu về các mô hình được hỗ trợ

Đối với ứng dụng di động và ứng dụng web, các SDK Firebase AI Logic cho phép bạn tương tác với các mô hình Geminicác mô hình Imagen được hỗ trợ ngay từ ứng dụng của bạn.

Các mô hình Gemini được coi là đa phương thức vì có khả năng xử lý và thậm chí tạo ra nhiều phương thức, bao gồm văn bản, mã, tệp PDF, hình ảnh, video và âm thanh. Bạn có thể dùng văn bản để nhắc các mô hình Imagen tạo hình ảnh.

Bảng sau đây là thông tin tổng quan ngắn gọn về các mô hình được hỗ trợ cho Firebase AI Logic và tên mô hình ổn định mới nhất của chúng. Bảng này cũng liệt kê các mô hình thử nghiệm và mô hình xem trước có sẵn để tạo mẫu cho các trường hợp sử dụng.

Ngoài ra, hãy xem Câu hỏi thường gặp của chúng tôi về tất cả các mô hình mà Firebase AI Logic hỗ trợ và không hỗ trợ.

Mẫu xe Gemini

Mô hình Mục nhập Đầu ra Mô tả
Các mô hình Gemini có phiên bản ổn định
Gemini 2.5 Pro
gemini-2.5-pro
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mô hình suy luận tiên tiến nhất của chúng tôi, có khả năng giải quyết các vấn đề phức tạp.
Gemini 2.5 Flash
gemini-2.5-flash
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mô hình tư duy của chúng tôi có nhiều khả năng toàn diện và hiệu quả. Thiết bị này được thiết kế để cân bằng giữa giá và hiệu suất.
Gemini 2.0 Flash
gemini-2.0-flash-001
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mô hình đa phương thức của chúng tôi có các tính năng thế hệ mới và khả năng được cải thiện, bao gồm tốc độ vượt trội, khả năng sử dụng công cụ tích hợp và cửa sổ ngữ cảnh 1 triệu token
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mô hình Flash nhanh nhất và tiết kiệm chi phí nhất của chúng tôi. Đây là một lộ trình nâng cấp cho người dùng 1.5 Flash muốn có chất lượng tốt hơn với cùng mức giá và tốc độ.
Các mô hình Gemini chỉ có phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng tạo mẫu)
Gemini 2.5 Flash‑Lite
gemini-2.5-flash-lite-preview-06-17
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mô hình Gemini cân bằng nhất của chúng tôi, được tối ưu hoá cho các trường hợp sử dụng có độ trễ thấp.
Gemini 2.0 Flash Image Generation
gemini-2.0-flash-preview-image-generation
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh hình ảnh, văn bản và hình ảnh Mô hình đa phương thức của chúng tôi hỗ trợ đầu vào đa phương thức và đầu ra là hình ảnh.
Gemini 2.0 Flash Live 1
gemini-2.0-flash-live-preview-04-09
văn bản (truyền trực tuyến),
âm thanh (truyền trực tuyến)
văn bản (truyền trực tuyến),
âm thanh (truyền trực tuyến)
Mô hình đa phương thức của chúng tôi hỗ trợ truyền phát trực tiếp theo thời gian thực với độ trễ thấp cho các dữ liệu đầu vào và đầu ra đa phương thức.

1 Không được hỗ trợ khi dùng Gemini Developer API với SDK Firebase AI Logic.

Mẫu xe Imagen

Mô hình Mục nhập Đầu ra Mô tả
Các mô hình Imagen có phiên bản ổn định
Imagen 3
imagen-3.0-generate-002
văn bản hình ảnh Tạo hình ảnh chân thực, chất lượng cao từ câu lệnh bằng văn bản ngôn ngữ tự nhiên
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
văn bản hình ảnh Tạo hình ảnh để tạo mẫu hoặc các trường hợp sử dụng có độ trễ thấp
Các mô hình Imagen chỉ có phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng tạo mẫu)
Imagen 4 2
imagen-4.0-generate-preview-06-06
văn bản hình ảnh Tạo hình ảnh chân thực, chất lượng cao từ câu lệnh bằng văn bản ngôn ngữ tự nhiên
Imagen 4 Fast 2
imagen-4.0-fast-generate-preview-06-06
văn bản hình ảnh Tạo hình ảnh để tạo mẫu hoặc các trường hợp sử dụng có độ trễ thấp
Imagen 4 Ultra 2
imagen-4.0-ultra-generate-preview-06-06
văn bản hình ảnh Tạo hình ảnh chân thực, chất lượng cao từ câu lệnh bằng văn bản ngôn ngữ tự nhiên

2 Imagen không hỗ trợ mô hình Gemini Developer API này, bất kể bạn truy cập vào API theo cách nào.


Phần còn lại của trang này cung cấp thông tin chi tiết về các mô hình mà Firebase AI Logic hỗ trợ.

Ở cuối trang này, bạn có thể xem thông tin chi tiết về các mẫu cũ.



So sánh các mô hình

Mỗi mô hình có các khả năng khác nhau để hỗ trợ nhiều trường hợp sử dụng. Xin lưu ý rằng mỗi bảng trong phần này mô tả từng mô hình khi được dùng với Firebase AI Logic. Mỗi mô hình có thể có thêm các chức năng không có sẵn khi sử dụng SDK của chúng tôi.

Nếu không tìm thấy thông tin bạn cần trong các mục phụ sau, bạn có thể tìm thêm thông tin trong tài liệu của nhà cung cấp API mà bạn chọn:

Đầu vào và đầu ra được hỗ trợ

Đây là các loại đầu vào và đầu ra được hỗ trợ khi sử dụng từng mô hình với Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Tạo hình ảnh </span="notranslate">
<span="notranslate">Gemini
2.0 Flash –
Live </span="notranslate">
Imagen
Loại dữ liệu đầu vào
Văn bản
Văn bản (phát trực tuyến)
Tài liệu
(PDF hoặc văn bản thuần tuý)
Hình ảnh
Video
Âm thanh
Âm thanh (truyền trực tuyến)
Loại đầu ra
Văn bản
Văn bản (phát trực tuyến)
Đầu ra có cấu trúc
(chẳng hạn như JSON)
Hình ảnh
Âm thanh
Âm thanh (truyền trực tuyến)

Để tìm hiểu về các loại tệp được hỗ trợ, hãy xem phần Các tệp đầu vào được hỗ trợ và yêu cầu.

Các tính năng và chức năng được hỗ trợ

Sau đây là các tính năng và chức năng được hỗ trợ khi dùng từng mô hình với Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Tạo hình ảnh </span="notranslate">
<span="notranslate">Gemini
2.0 Flash –
Live </span="notranslate">
Imagen
Tạo văn bản từ dữ liệu đầu vào chỉ có văn bản hoặc dữ liệu đầu vào đa phương thức xen kẽ hoặc là một phần của hình ảnh chỉ phát trực tuyến
Tạo hình ảnh
(Gemini hoặc Imagen)
Tạo âm thanh chỉ phát trực tuyến
Tạo đầu ra có cấu trúc
(chẳng hạn như JSON)
Phân tích tài liệu
(Tệp PDF hoặc văn bản thuần tuý)
Phân tích hình ảnh (thị giác)
Phân tích video (thị giác)
Phân tích âm thanh chỉ phát trực tuyến
Cuộc trò chuyện nhiều lượt
Lệnh gọi hàm (công cụ)
Đếm số lượng mã thông báo
Hướng dẫn về hệ thống
Truyền phát trực tiếp đa phương thức hai chiều

Quy cách và giới hạn

Đây là các quy cách và giới hạn khi sử dụng từng mô hình với Firebase AI Logic:

Tài sản <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
Tạo hình ảnh </span="notranslate">
<span="notranslate">Gemini
2.0 Flash –
Live </span="notranslate">
Imagen
Cửa sổ ngữ cảnh *
Tổng giới hạn mã thông báo
(kết hợp đầu vào và đầu ra)
1.048.576 mã thông báo 1.048.576 mã thông báo 1.048.576 mã thông báo 1.048.576 mã thông báo 1.048.576 mã thông báo 32.768 mã thông báo 32.768 mã thông báo 480 mã thông báo
Giới hạn mã thông báo đầu ra * 65.536 mã thông báo 65.536 mã thông báo 65.536 mã thông báo 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo 8.192 mã thông báo ---
Ngày cắt kiến thức Tháng 1 năm 2025 Tháng 1 năm 2025 Tháng 1 năm 2025 Tháng 6 năm 2024 Tháng 6 năm 2024 Tháng 8 năm 2024 Tháng 8 năm 2024 ---
Tệp PDF (theo yêu cầu)
Số lượng tối đa
tệp PDF đầu vào **
3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp 3.000 tệp --- ---
Số trang tối đa
cho mỗi tệp PDF đầu vào **
1.000 trang 1.000 trang 1.000 trang 1.000 trang 1.000 trang 1.000 trang --- ---
Kích thước tối đa
cho mỗi tệp PDF đầu vào
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB --- ---
Hình ảnh (mỗi yêu cầu)
Số lượng hình ảnh
đầu vào tối đa
3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh 3.000 hình ảnh --- ---
Số lượng tối đa
hình ảnh đầu ra
--- --- --- --- --- 10 hình ảnh --- 4 hình ảnh
Kích thước tối đa
cho mỗi hình ảnh đầu vào được mã hoá base64
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB --- ---
Video (theo mỗi yêu cầu)
Số lượng tối đa
của tệp video đầu vào
10 tệp 10 tệp 10 tệp 10 tệp 10 tệp 10 tệp --- ---
Độ dài tối đa
của tất cả video đầu vào
(chỉ khung hình)
Khoảng 60 phút Khoảng 60 phút Khoảng 60 phút Khoảng 60 phút Khoảng 60 phút Khoảng 60 phút --- ---
Độ dài tối đa
của tất cả video đầu vào
(khung hình + âm thanh)
Khoảng 45 phút Khoảng 45 phút Khoảng 45 phút Khoảng 45 phút Khoảng 45 phút Khoảng 45 phút --- ---
Âm thanh (theo mỗi yêu cầu)
Số lượng tối đa
tệp âm thanh đầu vào
1 tệp 1 tệp 1 tệp 1 tệp 1 tệp 1 tệp --- ---
Số lượng tối đa
tệp âm thanh đầu ra
--- --- --- --- --- --- --- ---
Độ dài tối đa
của tất cả âm thanh đầu vào
Khoảng 8,4 giờ Khoảng 8,4 giờ Khoảng 8,4 giờ Khoảng 8,4 giờ Khoảng 8,4 giờ Khoảng 8,4 giờ --- ---
Độ dài tối đa
của tất cả âm thanh đầu ra
--- --- --- --- --- --- --- ---

* Đối với tất cả các mô hình Gemini, một mã thông báo tương đương với khoảng 4 ký tự, vì vậy 100 mã thông báo tương đương với khoảng 60 đến 80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu của mình bằng cách sử dụng countTokens.

** Tệp PDF được coi là hình ảnh, vì vậy một trang của tệp PDF được coi là một hình ảnh. Số lượng trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.

Tìm thêm thông tin chi tiết



Mẫu đặt tên và tạo phiên bản mô hình

Các mô hình được cung cấp ở phiên bản ổn định, xem trướcthử nghiệm. Để thuận tiện, các bí danh không có giá trị phiên bản rõ ràng đều được hỗ trợ.

Để tìm tên mẫu cụ thể cần dùng trong mã, hãy xem phần "tên mẫu có sẵn" ở phần sau của trang này.

Loại phiên bản /
Giai đoạn phát hành
Mô tả Mẫu tên kiểu thiết bị
Ổn định Ổn định: Các phiên bản này có sẵn và được hỗ trợ để sử dụng trong bản phát hành chính thức kể từ ngày phát hành.

Phiên bản mô hình ổn định thường được phát hành kèm theo ngày ngừng hoạt động, cho biết ngày cuối cùng mà mô hình này có hiệu lực. Sau ngày này, Google sẽ không còn hỗ trợ hoặc cho phép truy cập vào mô hình này nữa.

  • Các mô hình Gemini 2.5
    Tên mô hình của các phiên bản ổn định không có hậu tố

    Ví dụ: gemini-2.5-pro

  • Các mẫu Gemini 2.0Imagen
    Tên mẫu của các phiên bản ổn định được thêm một số phiên bản cụ thể gồm 3 chữ số

    Ví dụ: gemini-2.0-flash-001
    Ví dụ: imagen-3.0-generate-002

Bí danh ổn định được cập nhật tự động
(Chỉ dành cho các mẫu Gemini 2.0)
Tự động cập nhật: Các bí danh ổn định luôn trỏ đến phiên bản ổn định mới nhất của mô hình đó. Nếu một phiên bản ổn định mới được phát hành, thì bí danh auto-updated (tự động cập nhật) sẽ tự động bắt đầu trỏ đến phiên bản ổn định mới đó.

Chỉ dành cho các mẫu Gemini 2.0
Tên mẫu của các bí danh không có hậu tố

Ví dụ: gemini-2.0-flash

Xem trước Bản xem trước có các chức năng mới và được coi là không ổn định.

Bạn không nên sử dụng các mô hình này cho mục đích sản xuất, vì chúng có giới hạn tỷ lệ nghiêm ngặt hơn và có thể có các yêu cầu về việc thanh toán.

Đối với Vertex AI Gemini API, các mô hình xem trước được phát hành sau tháng 6 năm 2025 thường yêu cầu bạn đặt vị trí của mô hình thành global.

Tên mô hình của các phiên bản xem trước được thêm -preview cùng với ngày phát hành của mô hình (-MM-DD)

Ví dụ: gemini-2.5-flash-preview-04-17
(phát hành vào ngày 17 tháng 4 năm 2025)

Thử nghiệm Thử nghiệm có các chức năng mới và được coi là không ổn định.

Bạn không nên dùng các mô hình này cho mục đích sản xuất và chúng có hạn mức nghiêm ngặt hơn. Mô hình thử nghiệm được thiết kế để thu thập ý kiến phản hồi và cho phép thử nghiệm các tính năng mới nhất của chúng tôi.

Đối với Vertex AI Gemini API, các mô hình thử nghiệm được phát hành sau tháng 6 năm 2025 yêu cầu bạn đặt vị trí của mô hình thành global.

Tên mẫu của các phiên bản thử nghiệm được thêm -exp cùng với ngày phát hành của mẫu (-MM-DD)

Ví dụ: gemini-2.5-pro-exp-03-25
(phát hành vào ngày 25 tháng 3 năm 2025)

Đã nghỉ hưu Ngừng hoạt động là những phiên bản đã quá ngày ngừng hoạt động và đã bị vô hiệu hoá vĩnh viễn.

Google không còn hỗ trợ hoặc cho phép truy cập vào các mô hình không còn được dùng nữa và các yêu cầu tham chiếu đến một mã nhận dạng mô hình không còn được dùng nữa thường trả về lỗi 404.

---



Tên mẫu thiết bị hiện có

Tên mô hình là các giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi tạo mô hình.

Liệt kê tất cả các mô hình có sẵn theo phương thức lập trình

Bạn có thể liệt kê tất cả tên mô hình có sẵn bằng cách sử dụng REST API:

Xin lưu ý rằng danh sách được trả về này sẽ bao gồm tất cả các mẫu mà nhà cung cấp API hỗ trợ, nhưng Firebase AI Logic chỉ hỗ trợ các mẫu GeminiImagen được mô tả trên trang này. Cũng xin lưu ý rằng các bí danh được cập nhật tự động (ví dụ: gemini-2.0-flash) không được liệt kê vì chúng là bí danh tiện lợi cho mô hình cơ sở.

Tên mẫu Gemini

Để xem các ví dụ về quá trình khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn bắt đầu sử dụng.

Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng và việc thanh toán), hãy xem mẫu đặt tên và lập phiên bản mô hình.

Tên mẫu Gemini 2.5 Pro

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.5-pro Phiên bản ổn định mới nhất của Gemini 2.5 Pro Lò luyện 2025-06-17 Không sớm hơn
2026-06-17
gemini-2.5-pro-preview-06-05 Phiên bản dùng thử trỏ đến phiên bản ổn định mới nhất của Gemini 2.5 Pro
(hiện là gemini-2.5-pro)
Xem trước 2025-06-05 Không sớm hơn
ngày 15/7/2025
gemini-2.5-pro-preview-05-06 Phiên bản xem trước trỏ đến phiên bản ổn định mới nhất của Gemini 2.5 Pro*
(hiện là gemini-2.5-pro)
Xem trước 2025-05-06 Không sớm hơn
ngày 15/7/2025
gemini-2.5-pro-preview-03-25 Phiên bản xem trước trỏ đến phiên bản ổn định mới nhất của Gemini 2.5 Pro*
(hiện là gemini-2.5-pro)
Xem trước 2025-03-25 Không sớm hơn
ngày 15/7/2025

* Các phiên bản xem trước hiện có của mô hình Gemini 2.5 Pro sẽ bắt đầu trỏ đến phiên bản ổn định vào ngày 19 tháng 6 năm 2025.

Tên mẫu Gemini 2.5 Flash

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.5-flash Phiên bản ổn định mới nhất của Gemini 2.5 Flash Lò luyện 2025-06-17 Không sớm hơn
2026-06-17
gemini-2.5-flash-preview-05-20 Phiên bản dùng thử trỏ đến phiên bản ổn định mới nhất của Gemini 2.5 Flash
(hiện là gemini-2.5-flash)
Xem trước 2025-05-20 Không sớm hơn
ngày 15/7/2025
gemini-2.5-flash-preview-04-17 Phiên bản xem trước trỏ đến phiên bản ổn định mới nhất của Gemini 2.5 Flash*
(hiện là gemini-2.5-flash)
Xem trước 2025-04-17 Không sớm hơn
ngày 15/7/2025

* Các phiên bản xem trước hiện có của mô hình Gemini 2.5 Flash sẽ bắt đầu trỏ đến phiên bản ổn định vào ngày 19 tháng 6 năm 2025.

Tên mẫu Gemini 2.5 Flash‑Lite

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.5-flash-lite-preview-06-17 Phiên bản xem trước ban đầu của Gemini 2.5 Flash‑Lite Xem trước 2025-06-17 Sẽ được xác định sau

Tên mẫu Gemini 2.0 Flash

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.0-flash-001 Phiên bản ổn định mới nhất của Gemini 2.0 Flash Lò luyện 2025-02-05 Không sớm hơn
ngày 5 tháng 2 năm 2026
gemini-2.0-flash Bí danh tự động cập nhật trỏ đến phiên bản ổn định mới nhất của Gemini 2.0 Flash
(hiện tại là gemini-2.0-flash-001)
Lò luyện 2025-02-10 ---

Tên mẫu Gemini 2.0 Flash‑Lite

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.0-flash-lite-001 Phiên bản ổn định mới nhất của Gemini 2.0 Flash‑Lite Lò luyện 2025-02-25 Không sớm hơn
2026-02-25
gemini-2.0-flash-lite Bí danh tự động cập nhật trỏ đến phiên bản ổn định mới nhất của Gemini 2.0 Flash‑Lite
(hiện tại là gemini-2.0-flash-lite-001)
Lò luyện 2025-02-25 ---

Tên mẫu Gemini 2.0 Flash Image Generation

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.0-flash-preview-image-generation 1 Phiên bản xem trước của Gemini 2.0 Flash Image Generation Xem trước 2025-05-06 Sẽ được xác định sau

Tên mẫu Gemini 2.0 Flash Live

Chỉ có khi bạn dùng Vertex AI Gemini API làm trình cung cấp API.

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
gemini-2.0-flash-live-preview-04-09 1 Phiên bản xem trước của Gemini 2.0 Flash Live Xem trước 2025-04-09 Sẽ được xác định sau

1 Không được hỗ trợ khi dùng Gemini Developer API với SDK Firebase AI Logic.

Tên mẫu Imagen

Để xem ví dụ về cách khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn tạo hình ảnh bằng Imagen.

Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng và việc thanh toán), hãy xem mẫu đặt tên và lập phiên bản mô hình.

Tên mẫu Imagen 4

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
imagen-4.0-generate-preview-06-06 2 Phiên bản xem trước của Imagen 4 Xem trước 2025-06-06 Sẽ được xác định sau
imagen-4.0-generate-preview-05-20 2 Phiên bản xem trước của Imagen 4 Xem trước 2025-05-20 Không sớm hơn ngày 7 tháng 7 năm 2025

Tên mẫu Imagen 4 Fast

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
imagen-4.0-fast-generate-preview-06-06 2 Phiên bản xem trước của Imagen 4 Fast Xem trước 2025-06-06 Sẽ được xác định sau

Tên mẫu Imagen 4 Ultra

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
imagen-4.0-ultra-generate-preview-06-06 2 Phiên bản xem trước của Imagen 4 Ultra Xem trước 2025-06-06 Sẽ được xác định sau
imagen-4.0-ultra-generate-exp-05-20 2 Phiên bản thử nghiệm của Imagen 4 Ultra Thử nghiệm 2025-05-20 Không sớm hơn ngày 7 tháng 7 năm 2025

Tên mẫu Imagen 3

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
imagen-3.0-generate-002 Phiên bản ổn định mới nhất của Imagen 3 Lò luyện 2025-01-23 Không sớm hơn ngày 23/1/2026
imagen-3.0-generate-001 2 Phiên bản ổn định ban đầu của Imagen 3 Lò luyện 2024-07-31 Không sớm hơn ngày 31/7/2025

Tên mẫu Imagen 3 Fast

Tên mẫu thiết bị Nội dung mô tả Giai đoạn phát hành Ngày phát hành Ngày ngừng cung cấp
imagen-3.0-fast-generate-001 2 Phiên bản ổn định ban đầu của Imagen 3 Fast Lò luyện 2024-07-31 Không sớm hơn ngày 31/7/2025

2 Không được Gemini Developer API hỗ trợ bất kể cách bạn truy cập vào API.



Ngôn ngữ được hỗ trợ

Gemini

  • Tất cả các mô hình Gemini đều có thể hiểu và phản hồi bằng các ngôn ngữ sau:

    Tiếng Ả Rập (ar), tiếng Bengali (bn), tiếng Bulgaria (bg), tiếng Trung giản thể và tiếng Trung phồn thể (zh), tiếng Croatia (hr), tiếng Séc (cs), tiếng Đan Mạch (da), tiếng Hà Lan (nl), tiếng Anh (en), tiếng Estonia (et), tiếng Phần Lan (fi), tiếng Pháp (fr), tiếng Đức (de), tiếng Hy Lạp (el), tiếng Do Thái (iw), tiếng Hindi (hi), tiếng Hungary (hu), tiếng Indonesia (id), tiếng Ý (it), tiếng Nhật (ja), tiếng Hàn (ko), tiếng Latvia (lv), tiếng Litva (lt), tiếng Na Uy (no), tiếng Ba Lan (pl), tiếng Bồ Đào Nha (pt), tiếng Romania (ro), tiếng Nga (ru), tiếng Serbia (sr), tiếng Slovak (sk), tiếng Slovenia (sl), tiếng Tây Ban Nha (es), tiếng Swahili (sw), tiếng Thuỵ Điển (sv), tiếng Thái (th), tiếng Thổ Nhĩ Kỳ (tr), tiếng Ukraina (uk), tiếng Việt (vi)

  • Các mô hình Gemini 2.0 Flash, Gemini 1.5 ProGemini 1.5 Flash có thể hiểu và trả lời bằng những ngôn ngữ bổ sung sau đây:

    Tiếng Afrikaans (af), tiếng Amharic (am), tiếng Assam (as), tiếng Azerbaijan (az), tiếng Belarus (be), tiếng Bosnia (bs), tiếng Catalan (ca), tiếng Cebuano (ceb), tiếng Corsica (co), tiếng Wales (cy), tiếng Dhivehi (dv), tiếng Esperanto (eo), tiếng Basque (eu), tiếng Ba Tư (fa), tiếng Tagalog (Philippines) (fil), tiếng Frisia (fy), tiếng Ireland (ga), tiếng Gael Scotland (gd), tiếng Galicia (gl), tiếng Gujarati (gu), tiếng Hausa (ha), tiếng Hawaii (haw), tiếng Hmong (hmn), tiếng Haiti (ht), tiếng Armenia (hy), tiếng Igbo (ig), tiếng Iceland (is), tiếng Java (jv), tiếng Gruzia (ka), tiếng Kazakh (kk), tiếng Khmer (km), tiếng Kannada (kn), tiếng Krio (kri), tiếng Kurd (ku), tiếng Kyrgyz (ky), tiếng Latinh (la), tiếng Luxembourg (lb), tiếng Lào (lo), tiếng Malagasy (mg), tiếng Maori (mi), tiếng Macedonia (mk), tiếng Malayalam (ml), tiếng Mông Cổ (mn), tiếng Meiteilon (tiếng Manipuri) (mni-Mtei), tiếng Marathi (mr), tiếng Mã Lai (ms), tiếng Malta (mt), tiếng Myanmar (tiếng Miến Điện) (my), tiếng Nepal (ne), tiếng Nyanja (tiếng Chichewa) (ny), tiếng Odia (tiếng Oriya) (or), tiếng Punjabi (pa), tiếng Pashto (ps), tiếng Sindhi (sd), tiếng Sinhala (tiếng Sinhala) (si), tiếng Samoa (sm), tiếng Shona (sn), tiếng Somali (so), tiếng Albania (sq), tiếng Sesotho (st), tiếng Sunda (su), tiếng Tamil (ta), tiếng Telugu (te), tiếng Tajik (tg), tiếng Uyghur (ug), tiếng Urdu (ur), tiếng Uzbek (uz), tiếng Xhosa (xh), tiếng Yiddish (yi), tiếng Yoruba (yo), tiếng Zulu (zu)

Imagen

  • Phạm vi cung cấp chung: Tiếng Anh

  • Xem trước: Tiếng Trung (giản thể), tiếng Trung (phồn thể), tiếng Hindi, tiếng Nhật, tiếng Hàn, tiếng Bồ Đào Nha, tiếng Tây Ban Nha



Thông tin về các mẫu cũ

Firebase AI Logic hỗ trợ các mô hình Gemini đang hoạt động cũ (chẳng hạn như các mô hình Gemini 1.5).

Firebase AI Logic không hỗ trợ các mẫu Imagen cũ (chẳng hạn như Imagen 2).

Mô hình Mục nhập Đầu ra Được tối ưu hoá cho
Gemini 1.5 Pro
gemini-1.5-pro-002
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Hỗ trợ các nhiệm vụ suy luận phức tạp đòi hỏi nhiều thông tin hơn; ngữ cảnh dài 2 triệu token
Gemini 1.5 Flash
gemini-1.5-flash-002
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh văn bản, mã, JSON Mang đến hiệu suất nhanh chóng và linh hoạt cho nhiều loại tác vụ
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
văn bản, mã, tệp PDF, hình ảnh, video (chỉ khung hình) văn bản, mã Xử lý văn bản, hình ảnh và video để đưa ra phản hồi bằng văn bản hoặc mã. Không thể dùng cho cuộc trò chuyện.
Gemini 1.0 Pro
gemini-1.0-pro-002
văn bản, mã văn bản, mã Các tác vụ bằng ngôn ngữ tự nhiên, cuộc trò chuyện nhiều lượt bằng văn bản và mã, cũng như tạo mã



Các bước tiếp theo

Dùng thử các chức năng của Gemini API