Przeanalizujemy dane o pensjach, aby zrozumie膰 wzorce i korelacje mi臋dzy wiekiem, do艣wiadczeniem a zarobkami. To kluczowy krok przed przej艣ciem do Machine Learning.
Analiza obejmuje:
- Statystyki opisowe
- Rozk艂ady zmiennych
- Korelacje mi臋dzy cechami
- Identyfikacja wzorc贸w
Statystyki opisowe danych:

Kod Python – Analiza statystyczna:
# Analiza statystyczna
import pandas as pd
import numpy as np
# Statystyki opisowe
print("=== STATYSTYKI WIEKU ===")
print(f"艢redni wiek: {df['wiek'].mean():.1f} lat")
print(f"Mediana wieku: {df['wiek'].median()} lat")
print(f"Min wiek: {df['wiek'].min()} lat")
print(f"Max wiek: {df['wiek'].max()} lat")
print("\n=== STATYSTYKI PENSJI ===")
print(f"艢rednia pensja: {df['pensja'].mean():.0f} PLN")
print(f"Mediana pensji: {df['pensja'].median():.0f} PLN")
print(f"Min pensja: {df['pensja'].min():.0f} PLN")
print(f"Max pensja: {df['pensja'].max():.0f} PLN")
# Korelacje
correlation = df['wiek'].corr(df['pensja'])
print(f"\nKorelacja wiek-pensja: {correlation:.3f}")
Brak odpowiedzi