Pregunta complicada sobre eliminar duplicados según criterios

Hola tengo un excel con mas de 1 millón de registros de los cuales quiero eliminar duplicados que van de "1 a n" dups copio un poco de los títulos de las columnas, describo entre paréntesis 

id_sivila_datos_estudio
id_sivila_estudio_individual
Identificador_1 (apellido y nombre)
Identificador_2 (a veces nombre)
Tipo_Documento
Nro_Documento
nombre_patologia
Interpretacion_de_Resultado (puede ser confirmado o no confirmado)
fecha_toma_muestra
nombre_provincia_muestra
nombre_departamento_muestra
cod_depto_indec_muestra
nombre_localidad_muestra
cod_loc_indec_muestra
sexo...

año 

Y 50 campos más

Lo que necesito es primer criterio dni si se repite entonces compara apeynombre (identificador1) y si la patología es igual (puede suceder que entre por unos síntomas y se le haga estudios de varias ej hantavirus, dengue, leptospirosis...), solo deje uno que sea de Interpretacion_de_Resultado: confirmado y borre los demás repetidos siempre que sean del mismo "año", 

Para mi es muy complicado deducir la formula y me da igual que se pueda resolver con vb macro o formato condicional o con lo que sea (así sea en access, consultas, sql)

Nota: el dni se puede repetir por que aveces cargan con 00000000000 y puede haber mas de una persona con el mismo numero, por eso después comparo con el indentificador1 para evitar eso.

nota2: esto viene en access y por exportación pasa a excel para poder graficar y analizar los datos

nota3: esto lo tengo que hacer todos los lunes ya que se actualizan datos semanales todos los domingos y el buscar duplicados manualmente me vuelve loco con tantas filas

MUCHISIMAS GRACIAS

1 respuesta

Respuesta
1

Si tenés Excel en versión 2007 en adelante, podés utilizar la opción 'Quitar duplicados' del menú DAtos.

Alli deberás seleccionar las col que marcaste con negrita. Esto te dará como resultado 1 solo registro por cada nombre-doc-patología e interpretación.

Es decir que podrías llegar a tener 2 registros por cada nbre-doc-patología: 1 confirmado y otro NO confirmado.

Lo que te restará entonces es filtrar la tabla por la col de Interpretación, y elegir solo los cofirmados. Esta tabla resultante luego la podés pegar en otro destino.

Son pocos los pasos y podés generar la macro encendiendo la grabadora de, realizando todos los pasos y luego al finalizar y detenerla encontrarás en un módulo la macro.

Escribila aquí para que te la deje más ajustada para rangos de distinto nro de filas.

Si te presenta alguna dificultad realizar la quita de duplicados, enviame tu hoja a mi correo con solo algunos datos para desarrollarte la macro.

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas