python爬虫报错
xml.parsers.expat.ExpatError: not well-formed (invalid token): line 8, column 75
一般可能是因为写XML文件时粗心造成的语法错误,用firefox浏览器打开会提示非良好格式错误。比如文件中夹带了错误的非法字符如中文字符,文件源代码结尾处有波浪线等等。
但是有些是由于XML语法不允许出现某些字符。比如&
应该用“&”代替,这样才能被转译成想要的“&”。这种情况在URL中就会出现。
参考:http://www.iteye.com/problems/48025
更多替换:
小于号< 要替换成 <
大于号 > >
和 & &
单引号 ' '
双引号 " "
这些是XML文档中预定义好的实体。