Jak sprawdzić, czy dwa pliki są identyczne?

Ostatnia modyfikacja: 23 września 2025

Szukaj konkretnego pliku

Czasami trzeba upewnić się, że dwa pliki są dokładnie takie same, czyli że ich zawartość posiada identyczne dane. Mówimy wtedy o duplikatach.

Przedstawimy kilka technik w systemie Windows, aby to sprawdzić niektóre są prostsze, inne bardziej niezawodne.


1) Porównanie wizualne

Porównanie wizualne jest wymienione dla kompletności, ale nie jest to metoda niezawodna. Polega na otwarciu obu plików w odpowiednim programie i porównaniu tego, co widzimy na ekranie, np. dwóch obrazów w Paint lub dwóch dokumentów tekstowych.

Uwaga: dwa pliki wizualnie identyczne mogą mieć bardzo różne kodowania. Na przykład obraz w formacie BMP i inny w PNG mogą wydawać się identyczne gołym okiem, ale ich reprezentacja binarna może być całkowicie różna.

2) Porównanie rozmiaru plików

Porównanie rozmiaru w bajtach nie pozwala stwierdzić, czy dwa pliki są identyczne, ale szybko pozwala upewnić się, że są różne.

  • Jeżeli rozmiary są różne, pliki nie są identyczne.
  • Jeżeli rozmiary są takie same, nie można wyciągnąć wniosku trzeba użyć jednej z poniższych metod, aby potwierdzić identyczność.

Uwaga: upewnij się, że porównujesz rozmiar w bajtach, a nie w KB lub MB.

3) Porównanie przy użyciu funkcji skrótu

Funkcja skrótu generuje cyfrowy odcisk pliku, który kondensuje jego zawartość w krótkim ciągu znaków; to trochę jak odcisk palca. Istnieje wiele algorytmów skrótu o różnej niezawodności (MD5, SHA-1…).

Dla ilustracji przyjmijmy przykład . Ta funkcja skrótu polega po prostu na dodaniu wszystkich bajtów pliku. Daje słabe rezultaty, ale jest łatwa do zrozumienia.


Przykład czterech plików tekstowych (który zachowamy w dalszej części artykułu) po 8 znaków każdy:


Nazwa pliku Zawartość pliku
(8 znaków)
Suma kontrolna (SK)
File1.dat 00000123 SK = 0+0+0+0+0+1+2+3 = 6
File2.dat 00000123 SK = 0+0+0+0+0+1+2+3 = 6
File3.dat 00000124 SK = 0+0+0+0+0+1+2+4 = 7
File4.dat 00000142 SK = 0+0+0+0+0+1+4+2 = 7


  • Obserwacja 1: Pliki File1.dat i File2.dat mają taką samą sumę kontrolną (SK = 6), co jest normalne, bo są identyczne.
  • Obserwacja 2: Plik File3.dat różni się od dwóch poprzednich i ma inną SK (7).
  • Obserwacja 3: Problem pojawia się z plikami File3.dat i File4.dat; ich zawartość jest różna, ale mają tę samą sumę kontrolną (SK = 7)! Dzieje się tak głównie przy słabych funkcjach skrótu jak suma kontrolna. Nazywa się to kolizją.

Uwaga: Ta metoda nie porównuje bezpośrednio zawartości, a jedynie cyfrowy odcisk. Dla tysięcy dużych plików porównanie odcisków jest bardzo szybkie i efektywne.

Przykład obliczania odcisków w Windows:

Przykład z użyciem polecenia certutil (wbudowanego w Windows) z funkcją skrótu MD5. Z tych samych czterech plików, tylko dwa pierwsze mają ten sam MD5 38d822d2c9b62e572837d1b98447e52f, co oznacza, że są identyczne.


Składnia : C:\> certutil -hashfile nazwa_pliku MD5


certutil



« Chociaż bardzo wiarygodne, identyczny odcisk nie gwarantuje w 100%, że pliki są identyczne. »

4) Porównanie bit po bicie

Porównanie bit po bicie polega na sprawdzeniu każdego bitu obu plików. W przeciwieństwie do poprzedniej metody, daje 100% pewność, ale może trwać nieco dłużej.


Przykład porównania bit po bicie w Windows:

Przykład pokazuje użycie polecenia fc (file compare) wbudowanego w Windows.


Składnia : C:\> fc /b plik1 plik2


fc



W wyniku porównania parami:

  • Pliki File1.dat i File2.dat są identyczne.
  • Pliki File3.dat i File4.dat są różne.

Uzyskano ten sam wynik co przy poprzedniej metodzie.

5) Korzystanie z oprogramowania graficznego

Obie poprzednie metody działają, ale wymagają użycia wiersza poleceń, co staje się niewygodne przy dużej liczbie plików.

Windows nie posiada wbudowanego narzędzia graficznego do tego typu porównań, trzeba więc użyć programów zewnętrznych, które wymagają instalacji. Wśród dostępnych rozwiązań polecam Duplicate Media Finder, którego darmowa wersja wystarcza do porównania binarnego. Jego podejście do problemu (zobacz ten bardzo kompletny poradnik) jest szczególnie przemyślane i oryginalne. Zalecane do użycia zwłaszcza wtedy, gdy trzeba zarządzać dużą liczbą plików.