Publiczne dokumenty jako dane

Oświadczenia majątkowe bez przekopywania skanów

Przeszukiwalna baza publicznych oświadczeń majątkowych z linkami do źródeł, historią zmian i porównaniami między latami.

Co finansuje wsparcie

tokeny i przetwarzanie AI

hosting, baza danych i cache

nowe źródła i naprawy scraperów

Wesprzyj projekt

Problem

Jawne nie zawsze znaczy łatwe do sprawdzenia

Oświadczenia majątkowe są publiczne, ale często leżą w wielu BIP-ach, PDF-ach i skanach z ręcznym pismem. Kto ma co zbiera je w jednym miejscu, odczytuje i porządkuje, żeby można było wyszukiwać, porównywać lata i wrócić do dokumentu źródłowego.

Jak to działa

Od publicznego PDF-u do przeszukiwalnej bazy

Cztery etapy. Na każdym zapisujemy źródło i jakość odczytu, więc od dowolnej liczby da się wrócić do dokumentu

Pobranie

Automaty regularnie pobierają dokumenty ze stron Sejmu, Senatu, sądów, prokuratur i BIP-ów urzędów

Odczyt

AI odczytuje PDF-y i skany — także wypełnione ręcznie — i zapisuje, jak pewny jest odczyt

Strukturyzacja

Drugi model zamienia odczytany tekst na ujednolicone dane: majątek, dochody, zobowiązania

Publikacja

Dane trafiają do bazy i są dostępne w profilach, zestawieniach i wyszukiwarce — zawsze z linkiem do źródła

Pokrycie źródeł

Baza rośnie źródło po źródle

Ile instytucji każdego typu jest już w bazie, a ile czeka na dodanie

Parlament

Sejm i Senat

100%

2/2pełny katalog

Urzędy centralne

KPRM, MSWiA, SN i kolejne indeksy

38%

3/8brakuje 5

Sądy

sądy apelacyjne

64%

7/11brakuje 4

Prokuratury

okręgowe, regionalne i krajowa

12%

7/58brakuje 51

Miasta

miasta na prawach powiatu

14%

9/66brakuje 57

FAQ

Najczęstsze pytania

Krótko o źródłach, podstawie publikacji, jakości danych i zakresie bazy

Skąd pochodzą dane?

Dane pochodzą z publicznych dokumentów: BIP-ów (Biuletynów Informacji Publicznej), stron Sejmu, Senatu, sądów, prokuratur i urzędów. Przy wpisach pokazujemy dokument źródłowy, żeby można było sprawdzić pierwotną deklarację.

Czy te informacje można publikować?

Tak. Oświadczenia majątkowe osób publicznych są jawne z mocy prawa. Serwis porządkuje dokumenty, które instytucje publiczne mają obowiązek udostępniać. Szczegóły podstawy prawnej i RODO.

Czy dane mogą zawierać błędy?

Tak. Część dokumentów to skany i ręcznie wypełnione formularze, więc transkrypcja AI oraz ekstrakcja danych mogą się pomylić. Serwis obsługuje poprawki danych i pokazuje je przy profilu osoby. Przy wątpliwościach pierwszeństwo ma dokument źródłowy, a błąd można zgłosić przy profilu.

Od czego zacząć?

Jeśli szukasz konkretnej osoby, użyj wyszukiwarki osób. Jeśli chcesz porównać kwoty i składniki majątku, zacznij od zestawień. Jeśli interesują Cię całe grupy osób publicznych, wejdź w Grupy.

Czy serwis obejmuje wszystkich urzędników w Polsce?

Nie. Baza rośnie etapami, a poziom pokrycia różni się między źródłami. Aktualny zakres danych i luki pokazuje sekcja Pokrycie źródeł.

Dla osób ujętych w bazie

Zgłoszenia i ograniczenie ekspozycji

Co mogę zgłosić?

Możesz zgłosić błąd, korektę, ograniczenie ekspozycji albo usunięcie danych. Zgłoszenia oceniamy względem dokumentu źródłowego, zakresu jawności, wieku dokumentu, minimalizacji danych i aktualnego interesu publicznego. Najwygodniej użyć formularza „Zgłoś błąd” przy profilu albo napisać na kontakt@ktomaco.pl.

Czego nie publikujemy?

Nie chcemy publikować danych ustawowo wyłączonych z jawności, w szczególności adresów zamieszkania, dokładnego położenia nieruchomości, numerów identyfikacyjnych, podpisów ani informacji, które źródło wyłącza z publikacji. Jeśli taka informacja pojawiła się przez błąd źródła, transkrypcji AI albo ekstrakcji, potraktujemy zgłoszenie priorytetowo.

Jak zgłosić korektę albo ograniczenie ekspozycji?

W zgłoszeniu najlepiej podać link do profilu lub dokumentu, wskazać konkretne pole i krótko opisać problem. W przypadku starszych oświadczeń można też poprosić o ocenę, czy dalsza publiczna ekspozycja danych identyfikowalnych jest nadal konieczna. Pełna klauzula prywatności opisuje podstawę prawną i prawa osób.

Jak czytać zestawienia bez nadinterpretacji?

Zestawienia pokazują wartości zadeklarowane w jawnych oświadczeniach i odczytane automatycznie. Nie są oceną osoby ani zarzutem. Duże kwoty i duże zmiany warto sprawdzić w dokumencie źródłowym, zwłaszcza gdy pozycja jest oznaczona jako do weryfikacji.

Metodyka

Od każdej liczby można wrócić do dokumentu źródłowego

Każdy rekord zaczyna się od publicznego dokumentu. Pipeline zapisuje źródło, transkrypcję, wynik ekstrakcji, informacje o jakości skanu i koszty przetwarzania, żeby dało się wrócić od liczby do dokumentu.

Dane z oświadczeń bywają niepełne, odręczne albo niespójnie opisane, dlatego Kto ma co pokazuje ograniczenia zamiast udawać pełną pewność: brakujące kwoty, korekty, jakość transkrypcji i ręcznie zweryfikowane wartości.

Dane są odczytywane automatycznie z publicznych dokumentów i mogą zawierać błędy. W razie wątpliwości sprawdź źródło.

Transparentność kosztów

Poniżej przedstawiamy pełne koszty przetwarzania oświadczeń majątkowych przez modele AI. Każdy dokument jest transkrybowany i analizowany automatycznie.

Przetworzonych dokumentów

130 715

Całkowity koszt

3586,71 zł

982,56 USD

Średni koszt / dokument

0,0274zł

PLN na deklarację

Tokeny ogółem

3138.6M

2379.4M in / 530.7M out

Koszty per etap przetwarzania

Transkrypcja

Multimodalna transkrypcja PDF do tekstu

64%

2304,79 zł(632,00 USD)

Ekstrakcja danych

Strukturyzacja i analiza treści

36%

1281,92 zł(350,56 USD)

Wsparcie

Wsparcie finansuje przetwarzanie nowych dokumentów

Największy koszt to nie strona www, tylko odczyt i strukturyzacja tysięcy PDF-ów przez AI. Sekcja kosztów wyżej pokazuje dokładnie, ile to wynosi

Jednorazowo

Dorzuć się do przetworzenia kolejnej paczki dokumentów

Wpłać jednorazowo

Miesięcznie

Stałe wsparcie pokrywa przetwarzanie AI, hosting i dodawanie nowych źródeł

Wspieraj co miesiąc

Licencja i źródła

Możesz cytować i wykorzystywać dane — z podaniem źródła

Kto ma co porządkuje publicznie udostępnione oświadczenia majątkowe i dodaje do nich warstwę przeszukiwania, porównań oraz oznaczeń jakości. Nie przejmujemy praw do dokumentów źródłowych publikowanych przez instytucje publiczne.

Uporządkowane dane z serwisu można wykorzystywać z podaniem źródła „Kto ma co” oraz linkiem do odpowiedniego profilu, rankingu lub dokumentu. Przy publikacji istotnych ustaleń należy zweryfikować je w dokumencie źródłowym, bo automatyczna transkrypcja i ekstrakcja mogą zawierać błędy.

W sprawach masowego pobierania, wykorzystania komercyjnego, korekt danych albo pytań o zakres jawności napisz na kontakt@ktomaco.pl.

O autorze

Za projektem stoi Mateusz Kurek, data engineer pracujący z dużymi zbiorami, automatyzacją i jakością danych. Kto ma co powstało z potrzeby uporządkowania dokumentów publicznych tak, żeby dało się je szybko sprawdzić i porównać.

Kontakt

Pytania, zgłoszenia błędów w danych, współpraca dziennikarska albo techniczna

kontakt@ktomaco.pl