צעדים ראשונים ב-Python עבור מדען נתונים – חלק א' – התקנה וסביבת העבודה

במאמרים קודמים הוצגה שפת Python ככלי בעל פוטנציאל שדרוג גבוה מאוד עבור כל מדען נתונים.
בסדרת מאמרים זו תוצג סביבת העבודה של Python באופן בסיסי – לצורך התחלת השימוש בכלי, כולל התקנה, פקודות נפוצות וממשקים למקורות נתונים.

מאמר זה יעסוק בהתקנת סביבת העבודה של Python והסברים כיצד ניתן להתחיל לעבוד בשפה ולהפיק ממנה תועלות באופן מידי.

התקנת Python

הורד מ- https://www.python.org/downloads את גרסה 2.X.Y. קיימת גם גרסה מתקדמת יותר (3.X.Y), אך היא נתמכת באופן חלקי ונחשבת פחות יציבה.
לאחר ההורדה – התקן את הכלי.

סביבת העבודה ב-Python

קיימות מספר דרכים לגשת לעבודה עם Python, כולל Editors דוגמת Notepad++ (חינמי), Sublime (בתשלום) וכיו"ב.
לצורך הפשטות והתחלת עבודה מהירה, נתמקד בכלי הבסיסי המגיע עם הפצת ה-Python: ה-Shell. לאחר הבנת הבסיס, והתחלת קידוד של תוכניות מורכבות יותר – מומלץ לעבור לסביבת פיתוח משולבת (IDE), המאפשרת בין השאר קידוד, הרצה, Debugging ועוד מספר כלים משלימים.

ה-Python Shell הוא בעצם שורת פקודה – כותבים פקודה, לוחצים על Enter – ומקבלים תשובה (או 'צעקה' מהמערכת שיש טעות). נקרא ב-Windows גם Idle – Python GUI.
לדוגמה: אם נקליד נוסחה – נקבל את הפתרון עבורה:
python-shell-1.1
Script מאפשר כתיבת קוד מורכב יותר, והרצתו בבת אחת – בדומה ליצירת שאילתות מורכבות ב-SQL עם שמירת תוצאות ביניים בטבלאות. גישה לכתיבת Script מתבצעת דרך התפריט ב-Shell. לפני הרצת קוד ה-Script, יש לשמור אותו (חשוב להקפיד על סיומת .py), ולאחר מכן ניתן להריצו (לחיצה על כפתור F5) ולקבל תוצאה.
להלן דוגמה פשוטה – הצבת ערכים ב-4 משתנים, חישוב והדפסה על המסך של שתי נוסחאות (מכפלה וחזקה):
python-first-script-result-1.1

התקנת חבילות

לאחר ההתקנה ניתן להתקין תוספים/ חבילות בהתאם לצורך. חבילה היא בעצם קטע קוד (מעין פרוצדורה) שמישהו אחר בקהילה כתב, וניתן להוריד אותו, לעשות בו שימוש ולשנות אותו כמעט תמיד באופן חופשי לחלוטין. לדוגמה: קיים תוסף בשם time, אשר מאפשר מדידת זמני ריצה, תוסף בשם csv, המאפשר גישה פשוטה לקבצי csv – ועוד רבים אחרים.אפשר להוריד חבילות מאתרים רבים באינטרנט, מומלץ להתמקד באתר המרכזי לנושא:
https://pypi.python.org/pypi , או דרך https://github.com .
אם קיימות גרסאות נפרדות עבור 32/64 ביט, חשוב לוודא שהחבילה תואמת לגרסה המופיעה ב-Python Shell. לחבילה לא תואמת עשויות להיות בעיות תאימות – ושגיאות בעת ההתקנה.קיימות שתי עיקריות דרכים להתקין חבילות:
הראשונה היא התקנה 'אוטומטית' באמצעות קובץ msi\exe – אשר קיים לחבילות מסוימות. ההתקנה פשוטה מאוד – להוריד את הקובץ ולהפעיל אותו.הדרך השנייה היא הנפוצה יותר – התקנה ידנית (מה-source) – לרוב באמצעות קובץ דחוס בפורמט tar.gz.
לצורך הפשטות, נתמקד כאן במשתמשי Windows בלבד:

  • לאחר ההורדה, נדרש לחלץ את התוכן מהקובץ, מומלץ לפתוח תיקיית packages ייעודית לנושא.
  • לפתוח את ה-command line (התחל + “cmd”), ולגשת לתיקייה אליה נשמרה החבילה. מומלץ להקליד רק את התווים הראשונים של שם התיקייה/קובץ ולהשתמש בכפתור <Tab> להשלמת הכיתוב על המסך.
  • לרשום את הפקודה הבאה:
    C:\<Python folder>\python.exe setup.py install
    לאחר לחיצה על Enter, החבילה תותקן. להלן דוגמה עבור חבילה בשם pypdf:

python package tar.gz install 1

  • לאחר ההתקנה יש לסגור ולהפעיל מחדש את ה-Python Shell.
  • לבדוק שהחבילה הותקנה בהצלחה ע"י פקודת import. אם אין הודעת שגיאה לאחר הרצת קוד ה-import – ההתקנה הסתיימה בהצלחה, וניתן לעשות שימוש בחבילה. להלן דוגמה עם שתי חבילות: החבילה csv הותקנה בהצלחה (אין הודעות שגיאה), ואילו החבילה האחרת (דמיונית) מציגה הודעת שגיאה, המעידה על כך שאינה קיימת/ לא הותקנה כראוי.

python-package-install-qa-1.1

  • אופציונלי: למי שיודע כיצד לעדכן environment variables ב-Windows, מומלץ להוסיף לרשימת המשתנים את python.exe על מנת לקצר את פקודות ההתקנה של חבילות Python עתידיות.

עד כאן בהיבט התשתית. כעת צריך 'רק' ללמוד את התחביר של שפת הקוד. על כך – במאמר הבא.

השארת תגובה