Cuando el disco empieza a pedir auxilio, casi siempre el culpable es el mismo: copias repetidas, carpetas vacías, archivos enormes que olvidaste y contenido “parecido” que se te fue acumulando. Si tú buscas un buscador de archivos duplicados que también te ayude con más limpieza “de la de verdad”, Czkawka va justo a eso: localizar y ordenar el caos para que tú decidas qué se queda y qué sobra.
Buscador de archivos duplicados con tres formas de usarlo
Aquí no estás ante una única app con un único estilo. El proyecto incluye tres frontends independientes que comparten el mismo motor: un modo gráfico moderno llamado Krokiet (hecho con Slint), un modo gráfico más veterano basado en GTK 4, y una versión CLI para usar desde la terminal.
En la práctica, esto se traduce en libertad para ti: puedes elegir la interfaz que te resulte más cómoda sin renunciar a las mismas funciones. Krokiet se presenta como la GUI principal con una experiencia consistente entre Linux, Windows y macOS, y el proyecto considera a la GUI GTK como la interfaz “antigua” (sigue mantenida, pero con la idea de que Krokiet la reemplace con el tiempo).
Si lo tuyo es automatizar, el CLI también está pensado para eso: trae ayuda integrada en la propia terminal y devuelve códigos de salida (por ejemplo, éxito, error o “se encontraron archivos”) para que un script pueda reaccionar sin que tú estés mirando la pantalla.
Lo que encuentra Czkawka y lo que conviene saber antes
La gracia de Czkawka es que no se queda solo en “duplicados sí/no”. Reúne varias herramientas de limpieza bajo el mismo paraguas:
- Duplicados: detecta archivos repetidos basándose en nombre, tamaño o hash.
- Carpetas vacías y archivos vacíos: localiza lo que no aporta nada.
- Archivos grandes: te muestra los más pesados en la ubicación que elijas.
- Archivos temporales: busca temporales “básicos”.
- Imágenes similares: encuentra imágenes que no son idénticas (por ejemplo, diferente resolución o marcas de agua).
- Vídeos similares: busca vídeos visualmente parecidos.
- Música repetida: compara por etiquetas o leyendo el contenido para compararlo.
- Extras útiles: enlaces simbólicos rotos, archivos corruptos, extensiones que no encajan con el contenido, limpieza de EXIF, optimización de vídeo y detección de nombres “problemáticos”.
Un matiz importante: el propio repositorio comenta que BleachBit es especialmente fuerte eliminando temporales, mientras que Czkawka solo encuentra los más básicos. Traducción a lenguaje humano: si tu objetivo es una limpieza agresiva de temporales, quizá quieras otra herramienta; si tu problema son duplicados, “parecidos” y organización, aquí brilla.
Usos prácticos: limpiar sin sustos y sin tocar tu “carpeta sagrada”
El miedo típico con un limpiador es borrar algo que luego echas de menos. Czkawka tiene una idea muy útil para rebajar ese riesgo: las Reference paths (rutas de referencia).
Tú puedes marcar una carpeta (o incluso un archivo) como referencia para que participe en la comparación, pero quede protegida: las acciones automáticas no deberían moverla ni borrarla. Esto viene genial para comparar “carpeta de trabajo” contra “carpeta archivo” sin que la carpeta archivo corra peligro.
Un ejemplo real: mezclas fotos y documentos en Descargas, pero guardas lo ordenado en otra carpeta. Escaneas ambas, marcas la carpeta “buena” como referencia y dejas que el programa te señale lo repetido para que tú decidas. En ese punto, el buscador de archivos duplicados deja de ser una ruleta y se convierte en una herramienta con red de seguridad.
Si además te preocupa la fiabilidad al detectar repetidos, el proyecto sugiere usar el método de comprobación por hash como el más fiable, y dentro de sus opciones menciona Blake3 como un tipo de hash rápido “para la mayoría de casos”. En fotos “casi iguales”, también documenta un umbral de similitud con rangos orientativos y varios algoritmos de hash (por ejemplo, Gradient como recomendación general).
Rendimiento, caché y privacidad: lo que pasa en tu PC se queda en tu PC
Czkawka destaca por dos razones muy fáciles de entender. La primera: velocidad. Está escrita en Rust, usa multihilo y tiene soporte de caché para que los siguientes escaneos sean más rápidos que el primero. La segunda: privacidad. El repositorio afirma explícitamente que no tiene acceso a Internet y que no recoge información del usuario ni estadísticas.
Esa caché no es un misterio: son datos calculados (hashes, miniaturas, metadatos analizados) que se guardan para reutilizarlos entre frontends. La configuración, en cambio, es específica de cada interfaz y no se comparte por defecto (y el CLI ni siquiera guarda configuración).
También queda documentado dónde suelen guardarse configuración y caché en Linux, macOS, Windows y Flatpak, y que tú puedes cambiar rutas usando variables de entorno CZKAWKA_CONFIG_PATH y CZKAWKA_CACHE_PATH. Incluso se describe un enfoque para montar una versión portable apuntando ambos directorios a carpetas junto al ejecutable.
Alternativas si quieres otra filosofía
Que una herramienta haga muchas cosas no significa que sea la mejor para todo el mundo. En el propio repositorio se mencionan alternativas conocidas, tanto con interfaz gráfica como en terminal:
- GUI: DupeGuru, FSlint, AntiDupl.NET y Video Duplicate Finder.
- CLI: Fclones, Rmlint y RdFind.
Si tú priorizas una app con muchísimas opciones solo para duplicados o una especializada en temporales, puede que alguna te encaje mejor. Si lo que buscas es un buscador de archivos duplicados que además te ayude a revisar “lo raro” (rotos, vacíos, mal nombrados, similares), Czkawka es de las propuestas más completas dentro de su propio ecosistema.