--- library_name: scikit-learn tags: - sklearn - titanic --- # Zmienne użyte w modelu - Pclass (Passenger Class): Klasa biletu, która jest również wyznacznikiem statusu socjoekonomicznego. - 1 = 1. klasa (Upper) - 2 = 2. klasa (Middle) - 3 = 3. klasa (Lower) - Sex: Płeć pasażera (male – mężczyzna, female – kobieta). - Age: Wiek w latach. Jeśli wiek jest mniejszy niż 1, jest podany jako ułamek (np. 0.5). - SibSp (Siblings/Spouses): Liczba rodzeństwa (brother, sister, stepbrother, stepsister) lub małżonków (husband, wife) na pokładzie. - Parch (Parents/Children): Liczba rodziców (mother, father) lub dzieci (daughter, son, stepdaughter, stepson) na pokładzie. Niektóre dzieci podróżowały tylko z nianią, więc miały wartość 0. - Fare: Opłata za bilet (cena w funtach brytyjskich). - Embarked: Port zaokrętowania, czyli miejsce, w którym pasażer wsiadł na statek: - C = Cherbourg - Q = Queenstown - S = Southampton Przykład użycia modelu: ```python import joblib import pandas as pd from huggingface_hub import hf_hub_download import numpy as np repo_id = "studentscolab/titanic" model_path = hf_hub_download(repo_id=repo_id, filename="model.joblib") model = joblib.load(model_path) sample_data = pd.DataFrame([ {'Pclass': 3, 'Sex': 'male', 'Age': 25, 'SibSp': 0, 'Parch': 0, 'Fare': 7.5, 'Embarked': 'S'}, {'Pclass': 1, 'Sex': 'female', 'Age': 35, 'SibSp': 1, 'Parch': 0, 'Fare': 1.5, 'Embarked': 'S'} ]) np.set_printoptions(precision=10, suppress=True) print(sample_data) prediction = model.predict(sample_data) for p in prediction: print(f"Prognoza dla danych próbnych [{p}]: {'przeżył' if prediction[p] == 1 else 'nie przeżył'}") ```