SegCon与OTT服务分析:深度学习与机器学习的应用
立即解锁
发布时间: 2025-08-31 00:25:28 阅读量: 2 订阅数: 12 AIGC 

### SegCon与OTT服务分析:深度学习与机器学习的应用
#### 一、SegCon:用于结膜分割的新型深度神经网络
在图像分割技术领域,深度学习方法已展现出较高的准确率。目前用于结膜分割的先进方法准确率为93.79%,仍有提升空间。
##### (一)数据与方法
1. **数据集**
- 该研究的训练和测试数据集由印度北部一家三级医疗机构的医学专业人员在2022年3月至5月期间收集。
- 数据集包含324张贫血和非贫血儿童的眼部图像,这些图像是在非受控环境下使用配备四个主摄像头(分辨率分别为64 MP、8 MP、2 MP和2 MP)的智能手机应用程序拍摄的。
- RGB彩色图像在5 - 14厘米的距离处以自动对焦设置拍摄,然后以.png格式上传到远程服务器,并与每个患者关联。在拍摄这162名受试者的图像之前,已获得监护人/父母的知情同意。
- 使用CVAT工具手动创建结膜的真实多边形掩码,这些真实掩码与眼部图像一起用于训练、测试和验证所提出的模型。324张图像按80%和20%的比例随机分为训练集和测试集。
2. **数据增强和预处理**
- 由于卷积过程具有平移不变性,训练数据通过90°角增量的旋转进行增强,同时对数据集进行水平和垂直翻转。
- 这些增强技术应用于训练集的所有图像及其对应的掩码。
- 图像被下采样,分辨率降低到512 × 512,以提高训练时间并减少内存使用。为了作为模型输入,数据需要进行归一化处理。
3. **提出的模型**
- 提出了一种名为SegCon的深度神经网络,用于从眼部图像中分割结膜区域。SegCon受UNet架构的双路径方法启发。
- UNet(一种基于CNN的深度学习架构)在生物医学图像分割和其他语义分割领域中,在少量/适度数据上展示了快速且优越的分割结果。UNet架构采用双路径方法来检索和定位图像的完整上下文。
- SegCon与传统UNet模型的不同之处在于:
- 传统UNet模型包含四个收缩层和四个扩展层,而SegCon为了提高特异性,包含六个收缩层和六个扩展层。
- 在UNet模型中,每个阶段都有最大池化层,而在SegCon中,仅在最后两个阶段尝试最大池化,并在前几个级别用步长为2的卷积层代替。
- 该模型的架构包括收缩(左)和增长(右)阶段。收缩阶段的所有层块包括两个卷积层,随后是ReLU激活和步长为2的卷积。在收缩阶段,特征通道减半。在增长阶段,这些特征与增长阶段相应层的特征连接,然后是两个卷积层和ReLU。增长阶段的最终输出被馈送到一个卷积层,最后通过sigmoid函数生成结膜区域的掩码。为了防止模型过拟合,在两个阶段的所有层末尾都应用了dropout。
4. **评估指标**
- 模型的预测结果可分为以下几类:
- 真阴性(TN):当标签在真实情况中不存在时,模型正确推断出标签的缺失。
- 真阳性(TP):当标签与真实情况匹配时,模型成功推断出标签。
- 假阳性(FP):当模型推断出一个在真实情况中实际上不存在的标签时发生。
- 假阴性(FN):当模型未能识别出真实情况中实际存在的标签时发生。
- 使用以下常见指标来评估SegCon的性能:
- 准确率(Accuracy):准确率通过将正确预测的数量除以模型做出的总预测数量来确定,计算公式为:$Accuracy = \frac{TP + TN}{FP + FN + TP + TN}$。
0
0
复制全文
相关推荐










