PHP simplexml_load_file与特殊字符
虽然本周末很凉快,不过过的实在有些忙碌。合作方的电话是一个接着一个,而且巧的很,查明原因后都是simplexml_load_file解析惹的祸。
所以这里对使用PHP来解析XML的同学提出两点注意:
- 表面看到的不一定是真的,file_get_contents或者curl远程抓一下,看其是否是一个有效的XML
- 特殊字符是会引起simplexml_load_file解析XML失败的,函数会报错
第一家比较诡异,看源代码及IE页面,毛问题没有,函数就是报错。后来想了个办法,file_get_contents一下,发现丫的在XML数据前面和后面分别有一串数字。于是XML无法顺利解析,这个分析起来还好些,而另一个就堪称头疼了。
XML格式如下:
<Item ID="8861" UserName="30121740" NickName="ǒˇFEΙでァ" Grade="16" Repute="168" Sex="false" WinCount="138" TotalCount="229" ConsortiaName="圣域" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="31" FightPower="3032" />
</Result>
初步分析是由于 里面NickName乱码导致,于是试验另一地址:
<Item ID="7" UserName="13792776" NickName="龙哥" Grade="1" Repute="313119" Sex="true" WinCount="0" TotalCount="0" ConsortiaName="" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="34" FightPower="0" />
</Result>
毛问题没有,很显然是这个NickName乱码造成的。于是开始了漫长且无奈的沟通,不过人家合作方不认为自己的文件格式有问题,且一直在强调其他合作方没有此问题。
于是,我只能无语的说“大哥,咱的水平比不上其他合作方的啊,把我不想要的数据去掉好吗?其实我就想要个ID”。不过无果。最后得出的结论是居然告诉我要让用户去改用户名,喵了个咪的。
于是,苦苦搜索中,发现了这么一个同病相怜的哥们《如果xml文档里含有特殊字符时该怎么办》
原来,这个xml里有&符号,这个&符号在.NET里是可以正常读取的,但是在php里是不行的,php里如果加载的话会报错
再瞅一眼,这哥们文章里的XML格式咋和我的这么像,于是豁然开朗,这是同一家公司。最后没办法,人家不改,也只能我想办法了,用户还等着充值呢不是。于是一样,替换&符。
其实能实现的方法很多,比如说用正则,但是我想表达的意见是,咱能按文档上面来吗?你说的是XML格式,那就要保证这个XML格式可以被解析好吧?
文章作者:simaopig
本文地址:http://www.xiaoxiaozi.com/2010/07/12/1800/
版权所有 © 转载时必须以链接形式注明作者和原始出处!
好深奥的东东
[回复]
看了看不懂这些不知道是什么。
[回复]
:|
先留个言,以后可能用到。
[回复]
將 NickName 的 & 變成 & a m p ; 是否可行?
[回复]
—————————————————————————————————————
XML格式如下:
<Result value="true" message="Success!">
<Item ID="8861" UserName="30121740" NickName="ǒˇFEΙでァ" Grade="16" Repute="168" Sex="false" WinCount="138" TotalCount="229" ConsortiaName="圣域" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="31" FightPower="3032" />
</Result>
—————————————————————————————————————
[回复]
@taijimark
感觉应该不行。因为你即使换成 & a m p; 里面也仍然含有 &
所以感觉应该不成。不过可以试一下。
[回复]