首页 > PHP > PHP simplexml_load_file与特殊字符
2010七月12

PHP simplexml_load_file与特殊字符

虽然本周末很凉快,不过过的实在有些忙碌。合作方的电话是一个接着一个,而且巧的很,查明原因后都是simplexml_load_file解析惹的祸。

所以这里对使用PHP来解析XML的同学提出两点注意:

  1. 表面看到的不一定是真的,file_get_contents或者curl远程抓一下,看其是否是一个有效的XML
  2. 特殊字符是会引起simplexml_load_file解析XML失败的,函数会报错


第一家比较诡异,看源代码及IE页面,毛问题没有,函数就是报错。后来想了个办法,file_get_contents一下,发现丫的在XML数据前面和后面分别有一串数字。于是XML无法顺利解析,这个分析起来还好些,而另一个就堪称头疼了。

XML格式如下:

<Result value="true" message="Success!">
  <Item ID="8861" UserName="30121740" NickName="&#x1A;ǒˇFEΙでァ" Grade="16" Repute="168" Sex="false" WinCount="138" TotalCount="229" ConsortiaName="圣域" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="31" FightPower="3032" />
</Result>

初步分析是由于 里面NickName乱码导致,于是试验另一地址:

<Result value="true" message="Success!">
  <Item ID="7" UserName="13792776" NickName="龙哥" Grade="1" Repute="313119" Sex="true" WinCount="0" TotalCount="0" ConsortiaName="" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="34" FightPower="0" />
</Result>

毛问题没有,很显然是这个NickName乱码造成的。于是开始了漫长且无奈的沟通,不过人家合作方不认为自己的文件格式有问题,且一直在强调其他合作方没有此问题。

于是,我只能无语的说“大哥,咱的水平比不上其他合作方的啊,把我不想要的数据去掉好吗?其实我就想要个ID”。不过无果。最后得出的结论是居然告诉我要让用户去改用户名,喵了个咪的。

于是,苦苦搜索中,发现了这么一个同病相怜的哥们《如果xml文档里含有特殊字符时该怎么办》

原来,这个xml里有&符号,这个&符号在.NET里是可以正常读取的,但是在php里是不行的,php里如果加载的话会报错

再瞅一眼,这哥们文章里的XML格式咋和我的这么像,于是豁然开朗,这是同一家公司。最后没办法,人家不改,也只能我想办法了,用户还等着充值呢不是。于是一样,替换&符。

其实能实现的方法很多,比如说用正则,但是我想表达的意见是,咱能按文档上面来吗?你说的是XML格式,那就要保证这个XML格式可以被解析好吧?

文章作者:simaopig
本文地址:http://www.xiaoxiaozi.com/2010/07/12/1800/
版权所有 © 转载时必须以链接形式注明作者和原始出处!

6 Responses to “PHP simplexml_load_file与特殊字符”

  1. #1 绿色丰兄 回复 | 引用 Post:2010-07-21 21:01

    好深奥的东东

    [回复]

  2. #2 回复 | 引用 Post:2010-07-28 15:25

    看了看不懂这些不知道是什么。

    [回复]

  3. #3 icyomik 回复 | 引用 Post:2010-09-19 22:04

    :|
    先留个言,以后可能用到。

    [回复]

  4. #4 taijimark 回复 | 引用 Post:2010-09-28 09:41

    將 NickName 的 & 變成 & a m p ; 是否可行?

    [回复]

  5. #5 taijimark 回复 | 引用 Post:2010-09-28 09:48

    —————————————————————————————————————
    XML格式如下:
    <Result value="true" message="Success!">

      <Item ID="8861" UserName="30121740" NickName="&#x1A;ǒˇFEΙでァ" Grade="16" Repute="168" Sex="false" WinCount="138" TotalCount="229" ConsortiaName="圣域" Rename="false" ConsortiaRename="false" EscapeCount="0" IsFirst="31" FightPower="3032" />

    </Result>
    —————————————————————————————————————

    [回复]

  6. #6 simaopig 回复 | 引用 Post:2010-09-28 09:55

    @taijimark
    感觉应该不行。因为你即使换成 & a m p; 里面也仍然含有 &

    所以感觉应该不成。不过可以试一下。

    [回复]

发表评论

:wink: :twisted: :roll: :oops: :mrgreen: :lol: :idea: :evil: :cry: :arrow: :?: :-| :-x :-o :-P :-D :-? :) :( :!: 8-O 8)