用MS生成了XML的规则

但是用 bbsExtra.setXsltFromFile("xslt_bbs.xml")

会提示报错

    result = bbsExtra.extract(doc)    # 调用extract方法提取所需内容
  File "/root/gooseeker.py", line 44, in extract
    xslt_root = etree.XML(self.xslt)
  File "src/lxml/lxml.etree.pyx", line 3192, in lxml.etree.XML (src/lxml/lxml.etree.c:78763)
  File "src/lxml/parser.pxi", line 1843, in lxml.etree._parseMemoryDocument (src/lxml/lxml.etree.c:118282)
ValueError: Unicode strings with encoding declaration are not supported. Please use bytes input or XML fragments without declaration.



环境Centos7 Python34
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-5-1 09:46

沙发
xiaoyuvps 初级会员 发表于 2017-4-30 19:10:02 | 只看该作者
这个问题倒是解决了。把第一行的UTF8去掉就行了。

但是问题再MS上可以测试成功的。 为啥在PYTHON里就测试不成功呢
举报 使用道具
板凳
Fuller 管理员 发表于 2017-4-30 22:46:19 | 只看该作者
xiaoyuvps 发表于 2017-4-30 19:10
这个问题倒是解决了。把第一行的UTF8去掉就行了。

但是问题再MS上可以测试成功的。 为啥在PYTHON里就测试 ...

这个可能跟xslt的解释器有关,我问一下python开发人员
举报 使用道具
地板
shenzhenwan10 金牌会员 发表于 2017-5-1 09:46:09 | 只看该作者
如果是直接copy xslt内容,第一行的UTF8确实要去掉,不然会出错
如果是调用api,就不用专门处理第一行,api接口已经做了处理
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-24 04:01