12月18日在火山引擎FORCE大会上,
字节跳动正式发布豆包视觉推理大模型,并宣布进入“厘时代”,价格降至0.003元/千token,比行业价格低85%,一块钱能够处理284张图片。
豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍。
看到这个消息, 大家会想到啥?
想起 之前智谱AI的GLM-4V-Flash免费, 我们可以利用大模型视觉推理 做很多事情。之前我写了一篇文章 【AI+编程】我用智谱AI写看图写话简单应用
关注我的读者都知道,我偶尔看看股票。那我们来分析下股票来试一下。
这里还是以GLM-4V-FLASH举例, 我准备找张图片分析下 。
大家先看效果
这里附上完整代码:
import streamlit as st
import os
import json
import base64
from dotenv import load_dotenv
import requests
from PIL import Image
from io import BytesIO
from tenacity import retry, stop_after_attempt, wait_exponential
API_KEY = "xxxxxxxxx"
if not API_KEY:
st.error("请设置 GLM_API_KEY 环境变量")
st.stop()
# API配置
API_URL = "https://open.bigmodel.cn/api/paas/v4/chat/completions"
HEADERS = {
"