Herramientas para cruzar y consolidar bases de datos

Que herramientas o fórmulas de excel puedo utilizar para cruzar, comparar y consolidar bases de datos, con mucha información.

1 respuesta

Respuesta
1

No sé si hay una herramienta especifica para eso. Lo que suelo hacer yo es generar un campo (una columna nueva) que tomando ciertos datos de cada fila me ayuden a determinar si el registro es único. Por decir algo: = Nombre & Apellido & Ciudad & fecha nacimiento.

Teniendo esa columna en ambas bases, genero una tercera a partir de los registros de esa columna con VLOOKUP. Luego ordeno y chequeo que lo que trae de una y de otra es realmente duplicado. Tal vez valga la pena agregar algun argumento adicional como "& Colegio" a la columna.

Finalmente, para limpio los registros dobles, usar Remove Duplicates en base a la columna generada.

no se, me tocaría ensayar. De pronto con la opción consolidar datos o función buscarv me podría ser útil?

El problema que encuentro es que de alguna manera tienes que explicarle a Excel cual es un dato duplicado y cual no.

Haciéndolo con Consolidar Datos recién lo probé y funciona muy bien. Pero tendrían que ser Bases de Datos con la misma estructura y con registros únicos en la primera columna de la izquierda.

La clave siempre está en cuál es ese registro único y decirle a Excel como resolver el problema de qué hacer con la información duplicada bajo un mismo identificador del registro.

Vamos a un ejemplo para que sea más claro:

Tengo 2 bases chiquitas simples, con solo dos campos, Nombre y Edad

La primera tabla es:

Pedro 15

Juan 20

La segunda tabla es:

Jorge 15

Juan 25

Javier 30

Consolido ambas en una nueva:

Pedro 15 (OK)

Jorge 15 (OK)

Javier 30 (OK) Hasta acá venimos bien porque son todos registros únicos.

Juan 22.5 (Lo resolví haciendo el promedio)

Con los registros únicos Pedro, Jorge y Javier no hay problema porque son únicos y solo traigo el único dato que tengo. Con Juan primero debería asegurarme de que se trata del mismo Juan (por eso la importancia de tener registros únicos que marcaba yo en mi primera respuesta). Si no fuera el mismo Juan, debería de alguna manera contar los "Juan" que hay y generar una columna nueva que los individualice en cada base, de manera que te quede un "Juan 1" y un "Juan 2" en lugar de dos Juanes.

Asumiendo que se trata del mismo Juan, hay que resolver que hacer con el dato 2. Se lo podes especificar a Excel. Yo puse Promedio, pero depende a que se refiera va a estar bien o mal.

Por ultimo, si tienes más campos, vas a hacer a resolver haciendo Promedio con todos los campos de los registros dobles.

Va ejemplo: Tablas Amarilla y Azul las consolide en Tabla Naranja

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas