用 Node.js 实现 Base64 图片上传并调用 Gemini 给图ai自动打标签,太方便了!
标签:Node.js、Base64、Gemini API、图片打标签、Google AI、多模态模型、前端上传
最近搞了个小玩意儿,在 Node.js 服务端接收前端上传的 Base64 图片,然后直接用 Gemini 模型自动打上详细标签,结果震惊我全家。这玩意儿居然能自己识别摩天大楼、玻璃幕墙、自然环境这些细节,真不愧是多模态模型!
下面就说说我是怎么一步步搞定这个功能的。
🛠 项目需求背景
公司内容审核团队最近希望可以初步识别用户上传图片的大致内容,比如这是一张城市风光,还是美食照,还是自拍照。于是我想着能不能让 AI 帮我自动打上标签?正好 Gemini 支持图片理解,果断上手试了下,效果非常不错。
🧪 测试示例结果
我随便上传了一张春笋照片,Gemini 居然给了这么一段:
以下是该图像的详细标签:
**结构:**
- 摩天大楼
- 建筑
- 地标
- 高层建筑
- 玻璃幕墙
- 钢架
- 外观
- 现代建