Otwarte dane

Eksport danych

Pobierz pełne zbiory oświadczeń majątkowych posłów i sprawozdań z wydatkowania ryczałtu biura poselskiego. Wybierz format, zaznacz interesujące lata - reszta to twoja sprawa. CC-BY 4.0, dane publiczne, dostępne bez rejestracji.

1036
Oświadczeń w bazie
729
Sprawozdań w bazie
2
Formaty: CSV, JSON
Zbiór danych

Oświadczenia majątkowe

Pełen indeks wartości z oświadczeń majątkowych posłów: nieruchomości, oszczędności, papiery, udziały, ruchomości, dochody, zobowiązania. Zawiera obliczone net worth z dedupem grup wartości.

Lata sprawozdawcze

|

Format

Zbiór danych

Sprawozdania ryczałtowe

Każde sprawozdanie z wydatkowania ryczałtu biura poselskiego (23 pozycje rozliczenia + suma + okres). CSV ma wiersz na pozycję, JSON zwraca pełne nested obiekty.

Lata sprawozdawcze

|

Format

Schemat danych

Co znajdziesz w pliku

Oświadczenia majątkowe

CSV: jeden wiersz na pozycję wartości (np. „Dom 250 m²”). JSON: nested - każda deklaracja zawiera listę wartości pogrupowanych po kategoriach.

declaration_idID deklaracji w bazie jakglosuja
member_id, first_name, last_name, clubIdentyfikacja posła
declaration_yearRok sprawozdawczy (np. 2024)
declaration_typeTyp: annual, post_election, end_of_term, etc.
filing_dateData złożenia
categorycash_pln, cash_fx, securities, property, shares, movable, income, liability
subkeyOpis pozycji (np. „Dom 250 m²”, „Honorarium”)
value_plnWartość w PLN (znormalizowana)
value_rawOryginalny tekst z PDF
parse_qualityparsed / approximate / unparseable / missing
value_group_idGrupa pozycji dzielących jedną kwotę (dedup)
net_worth_plnSuma aktywów minus zobowiązania (z dedupem grup)
source_url, pdf_urlLinki do oryginalnego PDF Sejmu RP

Sprawozdania ryczałtowe

CSV: jeden wiersz na pozycję rozliczenia (1-23 wg formularza). JSON: nested - każde sprawozdanie zawiera listę pozycji.

report_idID sprawozdania w bazie jakglosuja
member_id, first_name, last_name, clubIdentyfikacja posła
report_yearRok sprawozdawczy
periodOkres rozliczeniowy z PDF
position_numberNumer pozycji (1-23)
position_labelNazwa pozycji (np. „Wynagrodzenia pracowników biura”)
amount_plnKwota dla danej pozycji
report_total_plnSuma wydatków w sprawozdaniu
report_total_received_plnSuma otrzymanego ryczałtu
ocr_modelModel OCR użyty do parsowania
pdf_urlLink do oryginalnego PDF
FAQ

Najczęstsze pytania

Czy mogę używać tych danych komercyjnie?

Tak. Dane są na licencji CC-BY 4.0 - możesz je używać dowolnie, prosimy tylko o oznaczenie źródła „jakglosuja.pl”. Źródłem pierwotnym są publiczne dokumenty Sejmu RP.

Dlaczego niektóre wartości to „unparseable”?

Część oświadczeń ma niski jakościowo PDF (skan, odręczne dopiski). OCR czasem nie potrafi rozpoznać liczby - oznaczamy to jako „unparseable”, a oryginalny tekst zostawiamy w polu value_raw.

Co to jest value_group_id?

Niektóre pozycje deklaracji dzielą jedną kwotę (np. „Dom + Dom w budowie - 6 454 000 zł”). Wszystkie wiersze z tym samym value_group_id reprezentują tę samą kwotę - przy sumowaniu używaj net_worth_pln, które robi dedup za ciebie.

Czy CSV otworzy się w Excelu po polsku?

Tak. Plik ma BOM UTF-8 i separator średnik - Excel poprawnie wykryje kodowanie i kolumny.

Jak często aktualizujecie dane?

Nowe oświadczenia i sprawozdania wciągamy w ciągu kilku dni od publikacji na stronie Sejmu RP. Bieżąca data wygenerowania pliku jest w nazwie eksportu i w meta polu JSON.

Czy mogę pobrać dane przez API zamiast formularza?

Tak: GET /api/eksport/oswiadczenia?format=json&years=2024,2025. Parametr years jest opcjonalny - bez niego pobierzesz wszystkie dostępne lata.

Dane wygenerowane 2026-05-15 · Źródło pierwotne: orka.sejm.gov.pl