כיצד לתרגל Hadoop ברשת?
כאחת ממסגרות התוכנות בעלות קוד פתוח החזק ביותר, Hadoop הוא כלי חשוב לכל מי שמקווה למצוא משרה של נתונים גדולים. אם אתה רוצה להבריז את כישורי Hadoop שלך או ללמוד כיצד לשלוט בזה, האפשרות הטובה ביותר שלך היא לעבור קורס מקוון. אם זה לא זמין עבורך, צפה בהדרכות מקוונות בחינם והשתמש בחומרי עזר כדי לפתור בעיות ספציפיות. ברגע שיש לך את היסודות, תרגל קבוצות קטנות של נתונים אמיתיים כדי לשפר את כישוריך.
שיטה 1 מתוך 2: לימוד קורסים ושימוש בהדרכות
- 1הירשם ל- cloudera לקורס בן 6 חלקים והדרכות אינטראקטיביות. Cloudera נותן לך דוגמאות בעולם האמיתי להתאמן בסביבה לקריאה בלבד, כך שאתה לא צריך לדאוג לעשות טעויות ענק. הם מציעים גם כלים אנליטיים שיעזרו לך להתנסות בשאילתת נתונים, כמו גם הדגמה חיה בחינם בשם Cloudera Live שיעזור לך ללמוד את סביבת Hadoop.
- למרות שהקורס המלא ומעמיק עם הסמכה יעלה לכם 220 יורו, זה בהחלט יהיה שווה את זה אם תשתמשו במיומנויות אלה בתפקידכם. שימוש בקורס Cloudera יעזור לכם לתפוס טעויות ולחסוך זמן, מה שיגרום לו לשלם במהירות עבור עצמו!
- 2נסה קורסים מקוונים בחינם דרך Cloudera אם אתה כבר מכיר את היסודות. אם יש לך ניסיון עם Hadoop ורק רוצה רענון, ייתכן שלא תצטרך להפגיז את הכסף לקורס בן 6 חלקים. במקום זאת, עיין בקורסים המקוונים בחינם באתר אוניברסיטת קלודרה.
- ישנם משאבים עבור מנהלים, מפתחים ואנליסטים של נתונים, כך שלא משנה מה תפקידך, אתה אמור להיות מסוגל למצוא קורס מתאים.
- 3השתתף בקורס אוניברסיטאי על קורסים אם אתה רוצה יותר תיאוריה. קורסרה הוא מקור ידוע ומכובד של קורסי תכנות. למרות שההוראות בדרך כלל תיאורטיות יותר ואינן כוללות כמה שיותר דוגמאות ריצה, תוכלו להתאמן לצד ההדרכה ולהשתמש בפרויקטים של הקורס כדי לצבור ניסיון מעשי.
- קורס זה תוכלו למצוא באופן מקוון בכתובת https://coursera.org/specializations/big-data.
- העלות משתנה בין הקורסים, אך Coursera מציעה גם אפשרות סיוע כספי למי שמתאימים.
- 4עקבו אחר קורס חינמי באוניברסיטת ביג דאטה לקבלת אפשרות ידידותית. אם אינך רוצה לשלם עבור קורס מקוון, אוניברסיטת ביג דאטה היא אופציה נהדרת. יש להם קורס בן שני חלקים, שמתמקד תחילה ביסודות Hadoop, אחר כך בתכנות עם Hadoop, והפורמט המקוון מקל על הקצב שלך.
- תוכלו למצוא קורסים אלה בכתובת https://cognitiveclass.ai.
- הם מציעים שיעורים רבים באנגלית, כמו גם יפנית, ספרדית, פורטוגזית ורוסית.
- 5חפש הדרכות ב- YouTube אם אתה זקוק להכשרה ספציפית בחינם. ישנם אלפי סרטונים שנוצרו כדי להסביר את Hadoop וכיצד להשתמש בו. המגוון הרחב של הסרטונים מעניק לך גמישות ובנוסף זה בחינם. אם אתה נתקל בבעיה ספציפית, חפש ב- YouTube סרטון שיעביר אותך בתהליך.
- גם מדריכי Hadoop צריכים להיות קלים למדי למצוא, מכיוון ש- "Hadoop" הוא מונח חיפוש ייחודי.
- 6השתמש בהדרכות החינמיות של yahoo אם אתה רוצה להתאמן עם דוגמה וירטואלית. מדריכים אלו מחולקים לשבעה מודולים והם מדריכים אותך להתקין ולהפעיל את Hadoop כבר מההתחלה. זוהי אופציה נהדרת להתברג על כישורים ספציפיים אם הם מעט חלודים.
- תוכלו למצוא הדרכות אלה זמינות בחינם בכתובת https://developer.yahoo.com/hadoop/tutorial/.
- 7עיין במסמך הקוד הפתוח של IBM לקבלת הוראות מעמיקות בחינם. זהו מסמך PDF יסודי להפליא עם קוד פתוח שנוצר על ידי יוזמת הכשרה של IBM. זה מעביר אותך דרך Hadoop בזהירות, צעד אחר צעד, ונותן הוראות ברורות בכתב.
- תוכל למצוא PDF זה בכתובת https://ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
- הוראות אלה גם עובדות היטב כאשר הם משולבים עם הדגמה חיה כמו Cloudera.
שיטה 2 מתוך 2: מעבר ליישום בעולם האמיתי
- 1שאל אם אתה יכול ליישם Hadoop בעבודה כדי לתרגל עם נתונים אמיתיים. הגיש בקשה עם הבוס או המפקח שלך, או שוחח איתם אחד על אחד על הכנסת מיומנויות חדשות אלה למקום העבודה. זה חשוב במיוחד אם החברה שלך שילמה עבור כל הכשרה או קורסים מקוונים.
- ככל שתתחיל ליישם את המיומנויות שלמדת מוקדם יותר תוכל לשלוט בהן!
- 2חפש פרויקטים פשוטים לתרגול כישוריך. בחר פרויקטים פשוטים יחסית ובסיכון נמוך, כגון ספירה ודירוג של מספר האינטראקציות לסוכן לקוח, כמו מיילים והפעלות צ'אט.
- כמה יישומי נתונים אמיתיים אחרים כוללים סריקה דרך בלוגים לאיתור שגיאות או מעקב אחר ערוצי מדיה חברתית לרגש המותג.
- אתה יכול גם להתאמן על נתונים לדוגמה מאתרים כמו https://kaggle.com/datasets או https://aws.amazon.com/datasets/.
- 3בדוק באופן קבוע את הקוד שלך עם קבוצות משנה קטנות כדי לפתור את כל הבאגים. לפני הפעלת כל מערך הנתונים, קח מערך בדיקה קטן יותר למחשב המקומי שלך והפעל אותו בכמה מצבים שונים. לדוגמה, אתה יכול להריץ אותו באופן איטרטיבי דרך מצב Jobrunner מקומי, ואז מצב מבוזר פסאודו ואז מצב מופץ באופן מלא.
- זה יאפשר לך לזהות פגמים או באגים לפני שהם מוגברים במערך הנתונים המלא.
- מצב Jobrunner מקומי מאפשר לך לבדוק ולפתור באגים באופן מקומי ולהפחית קוד, מצב מבוזר פסאודו מחקה את סביבת הייצור ומצב הפצה מלאה מסתכל על אשכול הייצור האמיתי שלך.
- 4השתמש בתקופת ניסיון בחינם לשנה כדי להתאמן בסביבת מכונות וירטואליות. חברות כמו אמזון ומיקרוסופט מציעות מנויים בתשלום עבור שירותי התרגול שלהם ב- Hadoop. של אמזון מכונה וירטואלית הוא נקרא אמזון Web Service (AWS) ושירות של מיקרוסופט נקרא Microsoft Azure. עבור שני השירותים, השנה הראשונה שלך היא בחינם כאשר אתה מזין את פרטי כרטיס האשראי שלך.
- אל תשכח לבטל את המנוי לאחר שנה כדי להימנע מחיוב.
- זכור כי Hadoop היא שפת תכנות מתמחה יותר, לשימוש צר. זה בהחלט יעניק לך יתרון בעולם הביג דאטה, אבל לא תמיד צריך להיות מתכנת.
- אתה יכול גם לקרוא ספרים ומאמרים על Hadoop, כגון Hadoop: The Definitive Guide, מהדורה שלישית מאת טום ווייט.
קרא גם: כיצד להפוך במהירות למומחה אקסל?