

作者 佚名技术 来源 NET编程 浏览 发布时间 2012-03-13

又发现了一个 .net 的bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从 0xff 到 0xffff 之间的所有字符,正则表达式竟然也能匹配两个 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和数字。

比如以下的代码就是用来测试用正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。

  1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+"); 
  // The characters, whoes value are smaller than 0xff, are not expected to be matched. 
  for (int i = 0; i < 0xff; i++) { 
  string s = new string(new char[] { (char)i }); 
  string.Format("The character was not expected to be matched: 0x{0:X}!", i)); 
  // However, the characters whoes value are greater than 0xfe are expected to be matched. 
  for (int i = 0xff; i <= 0xffff; i++) { 
  string s = new string(new char[] { (char)i }); 
  string.Format("The character was expected to be matched: 0x{0:X}!", i)); 



1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);

程序运行的时候就会有两处断言错误。它们分别是字符值为 73 和 105,也就是小写字母 i 和大写字母 I。 这个 bug 非常奇怪,别的字符都很正常!而且用 javascript 脚本在 IE (版本是6.0)里面运行也同样有这么 bug 存在(比如下面这段代码)。然而在 Firefox 中运行就是没有问题的。还是 Firefox 好啊,呵呵!

1234567891011121314151617var re = /[/u00FF-/uFFFF]+/; 
  // var re = /[/u00FF-/uFFFF]+/i; 
  for(var i=0; i<0xff; i++) { 
  var s = String.fromCharCode( i ); 
  if ( re.test(s) ){ 
  alert( ''Should not be matched: '' + i + ''!'' ); 
  for(var i=0xff; i<=0xffff; i++) { 
  var s = String.fromCharCode( i ); 
  if ( !re.test(s) ){ 
  alert( ''Should be matched: '' + i + ''!'' ); 

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号