馃搳 Analiza danych – Statystyki i Korelacje

Przeanalizujemy dane o pensjach, aby zrozumie膰 wzorce i korelacje mi臋dzy wiekiem, do艣wiadczeniem a zarobkami. To kluczowy krok przed przej艣ciem do Machine Learning.

Analiza obejmuje:

  • Statystyki opisowe
  • Rozk艂ady zmiennych
  • Korelacje mi臋dzy cechami
  • Identyfikacja wzorc贸w

Statystyki opisowe danych:

Kod Python – Analiza statystyczna:

# Analiza statystyczna
import pandas as pd
import numpy as np

# Statystyki opisowe
print("=== STATYSTYKI WIEKU ===")
print(f"艢redni wiek: {df['wiek'].mean():.1f} lat")
print(f"Mediana wieku: {df['wiek'].median()} lat")
print(f"Min wiek: {df['wiek'].min()} lat")
print(f"Max wiek: {df['wiek'].max()} lat")

print("\n=== STATYSTYKI PENSJI ===")
print(f"艢rednia pensja: {df['pensja'].mean():.0f} PLN")
print(f"Mediana pensji: {df['pensja'].median():.0f} PLN")
print(f"Min pensja: {df['pensja'].min():.0f} PLN")
print(f"Max pensja: {df['pensja'].max():.0f} PLN")

# Korelacje
correlation = df['wiek'].corr(df['pensja'])
print(f"\nKorelacja wiek-pensja: {correlation:.3f}")

Brak odpowiedzi

Dodaj komentarz

Tw贸j adres e-mail nie zostanie opublikowany. Wymagane pola s膮 oznaczone *