编程疑难杂症の无法剔除的神秘重复记录
时间:2010-11-23 来源:Asion Tang
问题说明:
出问题的还是自己的一个项目:照片信息管理器。上次才发生一起《编程疑难杂症の设置正确却无效的事件代码》,这次呢,很不幸的又出现了一个“神秘”的问题。 如上图所示,程序读取了12条的测试样本信息,我的目的是测试“剔除重复信息”的功能。一看即知我想看到的结果是:当我点选了“剔除重复信息”的时候,ListView控件中只显示6条信息!很不幸的是,我点了,但是完全没有反应!
为了验证我的测试,我把同一份信息样本读取两次,所以现在总共就有了24条,那么现在每条信息就有了3条重复的。我想要的结果应该是只剩下6条!糟糕的是,程序给我的结果是12条!也就第一幅截图,那里首次读取的12条。
疑问:
经过上面的测试,让我觉得,似乎这个样本中,原本应该是重复的信息,宛然就是独立的,不重复的!也就意味着本来12条中,应该有6条是重复的,但是在软件“看来”:它们就是不重复的12条!!
假如说我的代码是完全错误的话,那么应该不会出现我后面测试的那种情况。因为,我用别的信息样本测试的时候,也都是完全正常的,而到了这里,假如把那样本中12条也“看做”是不重复的话,那么我的代码也算是工作正常的!
至此,这个问题就显得有那么一点“神秘”了。
调试跟踪:
问题还在,终究还得解决的,所以还是不停的尝试着调试!首先贴出需要调试的代码:
private void YERemoveTheSame() { //总是将当前列表框首次最完整的状态保存到lstListViewItems中。 if ( lstListViewItems.Count == 0 ) lstListViewItems.AddRange(lsvMessageShower.Items.Cast<ListViewItem>()); //将当前最新状态保存到lstListVIsame中。 if ( ckbRemoveTheSame.Checked ) { lstListVIsame.Clear(); lstListVIsame.AddRange(lsvMessageShower.Items.Cast<ListViewItem>()); lsvMessageShower.Items.Clear(); //【剔除重复信息的代码】 lsvMessageShower.Items.AddRange(lstListVIsame.Distinct<ListViewItem>(new DistinctComparer()).ToArray()); } else { lsvMessageShower.Items.Clear(); lsvMessageShower.Items.AddRange(lstListVIsame.ToArray()); } //当lstListVIsame被初始化之时,不要更新界面,那样会造成选取动作无法执行。 if ( lstListVIsame.Count != 0 ) YERefreshTheForm(); }
上面的代码是我的自定义方法,下面的是用于执行自定义剔除重复信息的比较器。lstListVIsame.Distinct<ListViewItem>(new DistinctComparer()).
//用于剔除重复信息的比较器。 class DistinctComparer : IEqualityComparer<ListViewItem> { #region IEqualityComparer<ListViewItem> 成员 int i =0,j=0; public bool Equals(ListViewItem x , ListViewItem y) { i++; Debug.Print("【i】:" + i.ToString()); Debug.Print("【x】:" + x.SubItems[ 3 ].Text); Debug.Print(x.SubItems[ 4 ].Text); Debug.Print("【y】:" + y.SubItems[ 3 ].Text); Debug.Print(y.SubItems[ 4 ].Text); if ( x.SubItems[ 0 ].Text == y.SubItems[ 0 ].Text && x.SubItems[ 1 ].Text == y.SubItems[ 1 ].Text && x.SubItems[ 2 ].Text == y.SubItems[ 2 ].Text && x.SubItems[ 3 ].Text == y.SubItems[ 3 ].Text && x.SubItems[ 4 ].Text == y.SubItems[ 4 ].Text ) return true; return false; } public int GetHashCode(ListViewItem obj) { j++; if ( i != 0 ) { Debug.Print("【j】:" + j.ToString()); Debug.Print("【obj】:" + obj.SubItems[ 3 ].Text); Debug.Print(obj.SubItems[ 4 ].Text); } //必须返回ToString值的hashCode才能实现相同剔除。 //只要返回的时间,内容的HashCode相同,则百分之99以上是相同的了。 //这样Equals的调用量就会少很多,只是增加了此GetHashCode的计算量。 return obj.SubItems[ 3 ].Text.GetHashCode() + obj.SubItems[ 4 ].Text.GetHashCode(); } #endregion }
在调试跟踪的时候,发现代码首先执行比较器中的GetHashCode函数,当返回的HashCode有相同记录的时候,才开始执行Equals函数。所以在跟踪调试第一截图的测试情况的时候,设置在Equals函数处的断点根本没有捕捉到!后来分析这种情况的话,可能的问题就出在GetHashCode函数里。我把断点放到了该函数里,然后对其进行逐语句调试。结果执行正常!这里的正常意思是说,执行到最后,都没有一次跳入Equals函数执行(这句貌似有点废话)。
但是,按照自己的代码思路,GetHashCode函数最后返回的是第4列的文本HashCode加上第5列的文本HashCode的和。之所以这样做,注释里面已经给出原因。因此自己“下意识”的觉得这里不会出现问题的,因为看截图一就知道,12条样本中的凡是相同信息的第4,5列都是相同的!既然相同,返回的HashCode也应该是相同的,那么HashCode都相同了,为什么它就死活不执行Equals函数呢!分析到此,彻底陷入僵局。
——2010年11月23日 20:38:08
功夫不负有心人:
这个问题出现后,死活想不通,心里就有了一个“坎”。要是解决不了的话,我想自己一定放不下的!所以呢,面对着“貌似正确”的代码,无论如何也要找出错误来!为了方便调试,我把比较器的代码修改了一下。如下:
public int GetHashCode(ListViewItem obj) { j++; if ( i != 0 ) { Debug.Print("【j】:" + j.ToString()); Debug.Print("【obj】:" + obj.SubItems[ 3 ].Text); Debug.Print(obj.SubItems[ 4 ].Text); } //必须返回ToString值的hashCode才能实现相同剔除。 //只要返回的时间,内容的HashCode相同,则百分之99以上是相同的了。 //这样Equals的调用量就会少很多,只是增加了此GetHashCode的计算量。 int a = obj.SubItems[ 3 ].Text.GetHashCode(); int b = obj.SubItems[ 4 ].Text.GetHashCode(); Debug.Print("4l:" + obj.SubItems[ 3 ].Text + ",HashCode:" + a.ToString()); Debug.Print("5l:" + obj.SubItems[ 4 ].Text + ",HashCode:" + b.ToString()); Debug.Print("+" + ( a + b ).ToString()); return a+b; }
这里呢目的是为了分离两列的HashCode,以充分分析两列“看似相同”的信息是否真的相同。结果呢,即时窗口真的出现了猫腻!
即时窗口输出信息