02之01
删除Excel中的重复数据记录
电子表格程序(如Excel)经常用作数据库,用于部件库存,销售记录和邮件列表等。
Excel中的数据库由通常组织成称为记录的数据行的数据表组成。
在记录中,行中每个单元格或字段中的数据都是相关的,例如公司的名称,地址和电话号码。
随着数据库规模的扩大,常见问题是重复记录或数据行。
如果发生以下情况,可能会发生此重复:
- 整个记录不止一次输入到数据库中,导致两个或更多相同的记录
- 多个记录具有一个或多个包含相同数据的字段(如名称和地址)。
无论哪种方式,重复记录都会导致一系列问题 - 例如,当邮件合并中使用数据库信息时,将多份文档邮寄给同一个人 - 因此,最好在常规扫描和删除重复记录基础。
虽然很容易在上图中的小样本中挑出重复记录,但数据表可能很容易包含数百个(如果不是数千个)记录,因此很难挑出重复的记录 - 特别是部分匹配的记录。
为了更容易地完成此任务,Excel有一个内置的数据工具,称为Remove Duplicates ,它可以用来查找和删除相同以及部分匹配的记录,这并不奇怪。
但是, 除去重复工具的设计方式,相同和部分匹配的记录必须分开处理。
这是因为“ 删除重复项” 对话框显示所选数据表的字段名称,并选择要在匹配记录搜索中包含哪些字段:
- 对于相同的记录,搜索所有字段 - 在所有列或字段名称旁边留下复选标记;
- 对于部分匹配的记录 - 仅在要匹配的字段旁留下复选标记。
字段名称与列字母
如前所述,Remove Duplicates工具由一个对话框组成,您可以通过勾选所需的字段或列名称来选择要搜索的匹配字段。
对话框中显示的信息(字段名称或列名称)取决于数据是否在数据表顶部包含一行标题(或标题 ),如上图所示。
如果确实如此 - 请确保对话框右侧的选项 - 我的数据具有标题 - 将被选中,Excel将在该行中显示名称作为对话框中的字段名称。
如果您的数据没有标题行,则对话框将在对话框中为所选数据范围显示适当的列字母。
连续的数据范围
为使删除重复工具正常工作,数据表必须是连续的数据范围 - 也就是说,它不能有任何空的行,列,并且如果可能的话,表中没有空单元 。
在数据表中没有空格是一种很好的做法,当涉及到数据管理时,而不仅仅是搜索重复数据时。 Excel的其他数据工具(如排序和过滤)在数据表是连续的数据范围时效果最佳。
删除重复的数据记录示例
在上面的图片中,数据表包含了A. Thompson的两个相同的记录和R. Holt的两个部分匹配记录 - 所有字段都匹配,除了学号。
下面列出的步骤详细说明如何使用删除重复数据工具:
- 删除A. Thompson的两个相同记录中的第二个。
- 删除R. Holt的第二部分匹配记录。
打开删除重复对话框
- 单击示例数据库中包含数据的任何单元格。
- 单击功能区上的数据选项卡。
- 单击删除重复图标突出显示数据表中的所有数据并打开删除重复对话框。
- “ 删除重复项” 对话框显示我们数据样本中的所有列标题或字段名称
- 字段名称旁边的复选标记指示Excel将在搜索重复记录时尝试匹配哪些列
- 默认情况下,当对话框打开时,所有的字段名都被关闭
查找完全相同的记录
- 由于我们在本例中搜索的是完全相同的记录,因此我们将检查所有列标题
- 点击确定
此时应该看到以下结果:
- 该对话框应该关闭并被一条消息所取代: 1找到并删除重复值; 剩下7个唯一值。
- 包含重复A. Thompson记录的行将从数据库中删除
- 即使R. Holt有两个部分匹配的记录,因为不是所有字段都匹配 - 两条记录的学生号码不同--Excel认为它是唯一的数据记录
02 02
通过删除重复查找和删除部分匹配记录
一次检查一个字段
由于Excel仅删除与所选数据字段完全匹配的数据记录,因此查找所有部分匹配的数据记录的最佳方法是一次仅删除一个字段的复选标记,如下面的步骤所述。
随后搜索除名称,年龄或程序以外的所有字段匹配的记录将删除部分匹配记录的所有可能组合。
部分匹配记录
- 如有必要,单击包含数据表中数据的任何单元格
- 单击功能区上的数据选项卡。
- 单击删除重复图标突出显示数据表中的所有数据并打开删除重复对话框。
- 数据表的所有字段名称或列标题均被选中。
- 要查找和删除每个字段中没有匹配的记录,请删除除Excel要忽略的字段名称以外的复选标记。
- 对于这个例子,点击Student ID列标题旁边的复选框来删除复选标记。
- Excel现在只会在姓氏 , 初始和程序字段中搜索并删除具有匹配数据的记录。
- 点击确定
- 该对话框应该关闭并被一条消息所取代: 1找到并删除重复值; 仍然有6个唯一值。
- 包含R. Holt的第二个记录(学号为ST348-252)的行将从数据库中删除。
- 单击确定关闭消息框
此时,示例数据表应该没有所有重复数据。