编程疑难杂症の真的非常一样的文本?!
时间:2011-01-03 来源:Asion Tang
问题描述:
首先,说明我要实现的功能:读取飞信聊天记录信息(TXT格式),并把凡是我发送的信息的发送人都放在“发送人2”这一列。即只要把信息中的发送人与界面上的“昵称”里面的字符串比对一样,即可!
问题就在,当两条信息发送人(看起来)都是一样的时候,偏偏一条放在了“发送人1”,另外一条才放到“发送人2”!这是Bug样本截图
这是Bug样本文件:真的非常一样的文本.zip
这是读取此信息的函数代码:
private bool YEReadFeiXin(string Contents)
{
//只有飞信的导出才有【\t】,没有的话直接退出。
if ( !Contents.Contains("\t(") )
return false;
try
{
#region 局部变量声明区
List<string> feixin = new List<string>();
List<string> feixinTEMP = new List<string>();
string Separators1 = "\t(";
string Separators2 = "\r\n";
if ( Contents.Contains("\r\r\n") )
Contents = Contents.Replace("\r\r\n" , "\r\n");//把飞信2010版本的导出格式转换为之前的格式。o(︶︿︶)o 唉!
string Separators3 = ")说:";
//定位当前【\t(】制表符的位置
int idxTab1 = 0;
//定位下一个Tab索引。
int idxTab2 = 0;
//定位当前制表符前面的该符号。
int idxNextLine1 = 0;
//定位从下个制表符开始的上一个【\r\n】符号所在位置
int idxNextLine2 = 0;
//定位【)说: 】的所在位置
int idx3 = 0;
//聊天的昵称
string name = "";
//发送时间
string time = "";
//聊天内容
string message = "";
bool isEnd = false;
#endregion
while ( !isEnd )
{
#region 分离各部分信息
/*
* 枫之梦23\t(2010-10-19 23:31:00)说: 好了,你快些完成你今天的任务睡觉吧!\r\n我先睡咯!\r\n
* 枫之梦23\t(2010-10-19 23:31:00)说: 好了,你快些完成你今天的任务睡觉吧!\r\n我先睡咯!\r\n
* 枫之梦23\t(2010-10-19 23:31:00)说: 好了,你快些完成你今天的任务睡觉吧!\r\n我先睡咯!
*/
//定位第一个[\t(]符号的位置。
idxTab1 = Contents.IndexOf(Separators1 , idxTab1 + 1);
//定位idxTab1前面的【\r\n】符号的位置。
idxNextLine1 = Contents.LastIndexOf(Separators2 , idxTab1);
if ( idxNextLine1 == -1 )
name = Contents.Substring(0, idxTab1);
else
name = Contents.Substring(idxNextLine1 + Separators2.Length , idxTab1 - idxNextLine1 - Separators2.Length);
//定位下一个【\t(】符号的位置。
idxTab2 = Contents.IndexOf(Separators1 , idxTab1 + 1);
//当不存在下一个【\t(】符号的时候,即没有下一行信息了。
if ( idxTab2 == -1 )
{
isEnd = true;
idxNextLine2 = Contents.Length;//除去后面占两个位的/r/n。
}
else
{
//定位从下个制表符开始的上一个【\r\n】符号所在位置
idxNextLine2 = Contents.LastIndexOf(Separators2 , idxTab2);
}
//定位【)说: 】的所在位置
idx3 = Contents.IndexOf(Separators3 , idxTab1);
time = Contents.Substring(idxTab1 + 2 , idx3 - idxTab1 - 2);
message = Contents.Substring(idx3 + 5 , idxNextLine2 - idx3 - 5);
#endregion
//输出显示。
int lastIndex = lsvMessageShower.Items.Count;
lsvMessageShower.Items.Add("飞信");
if ( name == MyNickName.Text )
{
lsvMessageShower.Items[ lastIndex ].SubItems.Add("");
lsvMessageShower.Items[ lastIndex ].SubItems.Add(name);
}
else
{
lsvMessageShower.Items[ lastIndex ].SubItems.Add(name);
lsvMessageShower.Items[ lastIndex ].SubItems.Add("");
}
lsvMessageShower.Items[ lastIndex ].SubItems.Add(time);
lsvMessageShower.Items[ lastIndex ].SubItems.Add(message);
}
return true;
}
catch ( Exception ex )
{
Debug.Print(ex.ToString());
return false;
}
}
尝试解决:
上次发表有一篇同样类型的文章,《编程疑难杂症の无法剔除的神秘重复记录》,里面的问题原因就是所比对的字符串里面包含“不可见字符”。所以首先想到的就是这次是否是一样的问题,结果却很不幸的没有能够解决!以下是VS2008调试界面截图:
可见,这里并没有什么特殊的“不可见字符”的。按照代码里面的逻辑,完全是可以把这两天信息完整的分离开来的。调试过程也证明了,代码逻辑并没有错。
我使用“监视”窗口,对提取出来的发送人Name变量,和界面上显示昵称的TextBox对象进行监视。看到的都是一样的字符串!
至此,我真的不知道这个问题的原因了!期望哪位朋友能帮解决。
程序源代码下载:
源代码の聊天记录管理器110103.zip
2011年1月3日 00:17:19
By:AsionTang
相关阅读 更多 +












