一次XSS漏洞引发的用户信息泄露 —— 在线教育平台真实案例剖析与防御实践-CSDN博客

本文链接：https://blog.csdn.net/qq_46371374/article/details/149438010

一、引子：一个“学习感言”输入框引发的安全事故

在一次大型在线教育平台的开发中，笔者曾亲身经历过一起严重的安全事故。事故的起点很微不足道：一个允许用户提交“学习感言”的输入框。然而，由于缺乏安全意识和输入输出处理的规范，这个字段成为攻击者入侵的跳板，最终导致大量用户信息泄露、信任危机和平台业务受损。

这个案例虽然已过去多年，但其中反映的安全盲点依然广泛存在于当前的互联网项目中，特别是在中小团队、快速上线、轻审计等背景下。本文将对这次事件做完整还原，帮助读者全面理解 XSS 攻击机制，以及如何进行系统性的防御。

二、业务背景与功能需求

该在线教育平台是一款服务于高校和职场用户的课程学习系统，主要功能包括：

用户注册与登录
个人主页展示
课程学习与评论
教师点评与打分

在个人主页中，系统允许用户填写“学习感言”用于展示自己对课程或平台的看法，这个功能初衷是增强社区互动性，提高平台用户黏性。

功能设计中，“学习感言”是一个可自由填写的大文本输入框，不受格式限制，支持多行输入。

三、问题根源：缺失输出转义的漏洞点

在功能实现过程中，前端页面的逻辑如下：

用户在注册或编辑资料时填写“学习感言”
前端页面使用AJAX提交数据
后端接口将数据存入MySQL数据库（未做内容清洗）
用户访问自己或他人主页时，后台从数据库取出原文直接拼接在HTML模板中展示

这意味着：攻击者输入的所有内容，在没有经过任何转义或过滤的情况下，被原样渲染到了浏览器中。

代码片段复现（简化版）：

后端模板（错误写法）：

<p>学习感言：${student.comment}</p>

假设用户输入：

<script>location.href='https://edu-login.fake.com'</script>

实际页面渲染结果：

<p>学习感言：<script>location.href='https://edu-login.fake.com'</script></p>

问题在于：

浏览器无法分辨这段是“展示内容”还是“需要执行的脚本”
所以它默认执行这段JS，发生跳转

四、攻击路径完整复现

为了更直观地说明漏洞利用过程，下面我们模拟攻击者的完整行为路径：

步骤 1：注册账号并注入恶意代码

攻击者在注册页面的“学习感言”中填入以下内容：

<script>location.href='https://edu-login.fake.com?from=home'</script>

该账号成功注册后，个人主页对其他用户公开展示该字段。

步骤 2：诱导他人点击其主页链接

攻击者将自己主页链接通过评论、消息、课程答疑等方式分发给其他用户，引导他们点击查看。

例如：

“我看这节课讲得特别好，我写了一段感言在我的主页上，欢迎大家交流：
https://edu.real.com/student/home?id=8723”

步骤 3：用户被重定向到伪造网站

其他用户点击该链接后，浏览器加载恶意脚本，自动跳转至：

https://edu-login.fake.com?from=home

该页面UI与真实平台一模一样，域名极其相似（例如使用 edu-login.fake.com 或 edu.real-edu.com），用户难以分辨真假。

步骤 4：钓鱼成功，敏感信息泄露

一旦用户在伪造页面重新输入账号密码，数据即被攻击者记录。借此，攻击者可登录用户真实账号，查看学习记录、私信内容、购买记录等，甚至修改绑定邮箱、手机号。

五、事件影响与业务损失

这次XSS攻击在被发现前，已有超过 800 名用户的账号信息被盗取，其中包括多位高校教师和VIP付费用户。造成的直接影响包括：

用户个人隐私数据泄露（手机号、学习进度、评论记录等）
数十名用户反馈资金异常使用（平台绑定了支付方式）
用户对平台安全性产生质疑，客服压力陡增
公司在舆情中被质疑安全管理不严，媒体曝光
内部整改投入上百万资源进行安全加固与审计

从根本上讲，这并不是一次黑客攻击，而是一次开发疏忽导致的安全事故。根因非常简单——没有对用户输入内容进行HTML转义处理。

六、XSS的本质与攻击原理

什么是XSS？

XSS（Cross-Site Scripting，跨站脚本攻击）是一种向网页注入恶意JavaScript代码的攻击方式。当其他用户访问被注入的页面时，这段脚本会自动执行，从而实现数据窃取、劫持会话、页面篡改等目的。

常见XSS分类：

类型	特点
存储型XSS	恶意脚本被保存在数据库或文件中，页面加载时自动执行（如本文案例）
反射型XSS	脚本附在URL参数中，用户点击后立即执行
DOM型XSS	前端JavaScript代码错误处理用户输入，造成注入

七、安全加固：如何正确防御XSS

1. 服务端输出转义：第一道也是最重要的防线

永远不要将用户输入直接嵌入HTML输出中！

推荐使用框架内置的转义工具，Java/Spring项目可以使用：

import org.springframework.web.util.HtmlUtils;

String escaped = HtmlUtils.htmlEscape(userInput);

输出后，恶意代码变成如下形式：

<p>学习感言：&lt;script&gt;location.href='...'&lt;/script&gt;</p>

浏览器将其作为普通文本展示，而非可执行脚本。

2. 模板引擎应默认开启转义功能

Thymeleaf：默认会对 ${} 内容进行HTML转义
FreeMarker：默认未开启，需要使用 ?html 显式处理
JSP：建议使用 JSTL <c:out> 标签进行安全输出

3. 严格限制内容富文本

如需支持部分HTML展示功能（如课程评论允许粗体、换行），可使用白名单过滤器（如 Jsoup、OWASP Java HTML Sanitizer）进行控制：

Whitelist whitelist = Whitelist.basic();
String safeHtml = Jsoup.clean(userHtmlInput, whitelist);

4. 客户端校验仅作辅助手段，不能作为安全边界

前端JS中的 replace()、htmlEncode() 等方式容易被绕过
攻击者可以直接构造请求，绕开页面

5. 防止表单欺诈（Form Hijacking）

在所有数据提交接口中加入：

验证码校验（防止脚本自动提交）
Referer 来源检查
CSRF Token

八、安全开发建议与实践总结

建议项	说明
所有用户输入必须清洗	包括评论、用户名、简介、富文本等
所有HTML输出必须转义	避免任何用户数据出现在页面时成为可执行代码
模板引擎使用安全输出语法	不要直接拼接字符串
采用白名单策略限制富文本	控制用户允许的标签、属性范围
定期使用安全扫描工具	如 OWASP ZAP、Nessus、Burp Suite 等检测XSS漏洞
敏感操作引入验证码或Token机制	防止自动提交、脚本伪造
设置内容安全策略（CSP）	阻止页面加载未授权脚本来源