谷姐:我们都是谷歌迷
We are all Google fans

请教python大佬指点下小弟关于utf-8编码问题-战神赵日天

Rate this post

这几天打算采集一些discuz的论坛用户

http://2bcpa.com/home.php?mod=space&uid=1(以此为例,这个站长兄弟,我只是正好看到你的论坛,以此举例,并非针对)

但是采集后的response.content数据内的中文,全部都是\x开头的编码,而符号和英文数据都是正常的

请教下如何采集这个页面获得的中文都是正常的,而不是\x编码

额,从今天中午研究到现在了,尝试了网上不同办法,依据没解决,还请了解的大佬写个几句指点下。。。

热议
2楼 iiss 4小时前

response.encoding="utf-8"

3楼 战神赵日天 4小时前

response.encoding="utf-8"

这个早就试过了,不行,完全没有反应,我甚至都在想,是不是我本地python缺少什么库,或者编码组件

4楼 iiss 4小时前

这个早就试过了,不行,完全没有反应,我甚至都在想,是不是我本地python缺少什么库,或者编码组件 ...

建议源码发出来

5楼 战神赵日天 4小时前

建议源码发出来

好滴,我源码马上上传,还请大佬帮忙指点

6楼 directlinkss 4小时前

你这不用.text而是用.content是为啥呢,.content是未解析的原始内容啊。

7楼 战神赵日天 4小时前

你这不用.text而是用.content是为啥呢,.content是未解析的原始内容啊。

我试试你说的先,多谢指点

8楼 战神赵日天 4小时前

建议源码发出来

大佬你好,刚才已经上传了rar,后来看到6楼大佬解答,我发现测试下,就ok了,因为我的确是属于python界的文盲,所以的确这种基础问题都没搞懂,已经可以打印出中文了,感谢大佬指点。

9楼 战神赵日天 4小时前

你这不用.text而是用.content是为啥呢,.content是未解析的原始内容啊。

感谢大佬指点,目前已经输出中文了,因为我的确是从未基础性的学习过python,还请见谅,再次感谢。如果后面在遇到问题,再请教大佬你。

10楼 Tankie 2小时前

我告诉你这个产生的原因吧。

原始数据 json.dumps 没有加ensure_ascii 然后http到客户端就成这样子
如果 json.dumps(data,ensure_ascii=False) 浏览器数据就不会出现这个。

那么怎么解决呢,其实不是UTF解码的问题,记得以前我搞过一次,解决方法是先encode再重新decode一遍(具体忘了,当时也是百度解决的)
另外根据产生的原因,我觉得也可以试下用json来解决,json.parse出来应该没问题。

申明:本文内容由网友收集分享,仅供学习参考使用。如文中内容侵犯到您的利益,请在文章下方留言,本站会第一时间进行处理。

未经谷姐允许不得转载:谷姐靓号网 » 请教python大佬指点下小弟关于utf-8编码问题-战神赵日天
分享到: 生成海报

热门文章

评论 抢沙发

评论前必须登录!

立即登录   注册

买Google Voice认准【谷姐靓号网】

Google Voice靓号列表Google Voice自助购买
切换注册

登录

忘记密码 ?

切换登录

注册

我们将发送一封验证邮件至你的邮箱, 请正确填写以完成账号注册和激活