محتوي المقال
ما هي الأربع مهارات الأساسية؟
1 – يجب أن تتعلم كيفية كتابة كود عالي الجودة 🐍
إذا كنت تعمل في Python ، فعليك اتباع دليل النمط باستمرار (عادةً PEP8). يجب أن تكتب كودًا معياريًا (في شكل وظائف وفئات) يمكن إعادة استخدامه واختباره. يجب اختيار أسماء المتغيرات بعناية.
الهدف هو كتابة رمز أقرب ما يمكن إلى التوثيق الذاتي. يمكن أن يساعد اختيار بعض مبادئ التصميم في جعل الكود الخاص بك أكثر قابلية لإعادة الاستخدام وقابلية للتمديد. نصيحتي هنا هي أن تحلم بأحلام كبيرة ، لكن تبدأ صغيرة. لكل أسبوع ، ابحث عن جزء جديد من التعليمات البرمجية يمكنك تحسينه. ستندهش من السرعة التي يمكنك بها تحسين مهاراتك.
2 —يجب أن تتعلم كيفية استخدام سطر الأوامر 💻
يعد تعلم استخدام سطر الأوامر (عادةً bash لعلوم البيانات) مفيدًا للغاية. تعد العديد من أدوات سطر الأوامر (مثل csvkit و curl) مفيدة للغاية لعالم البيانات.
ولكن أكثر من مجرد أداة محددة ، فإن مجرد التفكير في الشعور بالراحة مع العيش في سطر الأوامر مفيد حقًا. عند إتقانه ، يصبح سطر الأوامر أفضل صديق لك بدلاً من عدوك. نصيحتي هي أن تبدأ بدورة تمهيدية عامة على سطر الأوامر (هناك الكثير من الدورات المجانية على سبيل المثال YouTube) أو أن تبدأ بـ csvkit. بالنسبة إلى csvkit ، لقد أنشأت سلسلة فيديو مجانية يمكنك التحقق منها للبدء 😸
3 —يجب أن تتعلم كيفية استخدام التحكم في الإصدار 💾
سيقوم برنامج التحكم في الإصدار (Git عادةً) بتجميع التغييرات بمرور الوقت على قاعدة التعليمات البرمجية الخاصة بك في أجزاء يمكنك الرجوع إليها. هذا يجعل عملية الترميز موثوقة ولا يفقد أي شيء دون داع. عندما يتم ذلك بشكل صحيح ، يمكن للعديد من المساهمين العمل في نفس المشروع دون القلق بشأن كسر كود بعضهم البعض.
في العالم الحديث ، يجب أن يكون استخدام التحكم في الإصدار أمرًا مفروغًا منه في أي فريق علم بيانات جاد. في ذلك ، يمكنك إدخال تغييرات جديدة تدريجيًا أو الرجوع إلى الإصدارات السابقة إذا لزم الأمر.
4 – يجب أن تتعلم كيفية كتابة الاختبارات ⏰
اختبارات الكتابة تضمن موثوقية التعليمات البرمجية الخاصة بك. في حالة حدوث تعديلات على الشفرة (ولنكن حقيقيين ، فمن المحتمل أن يتم تعديلها بطريقة ما) ، فيمكنك القيام بذلك بأمان من خلال التأكد من اجتياز جميع الاختبارات. ستجبرك كتابة الاختبارات على الكود الخاص بك على التفكير في حالات الحافة ، وبالتالي تصبح أكثر وعياً بالكود الخاص بك.
إن معرفة كيفية إعداد الحد الأدنى من بيئة CI / CD لتقييم الاختبارات تلقائيًا أمر مفيد للغاية أيضًا. ولكن إذا كنت جديدًا في الاختبار ، فأقترح أن تبدأ بكتابة بعض اختبارات الوحدة الأساسية باستخدام مكتبة pytest في Python.
موضوعات أخرى؟
لا ينبغي النظر إلى الموضوعات الأربعة المذكورة أعلاه على أنها قائمة شاملة. موضوعات أخرى ، مثل النقل بالحاويات على سبيل المثال تطوير Docker و REST-API مع على سبيل المثال FastAPI هي أيضًا مواضيع مهمة. ومع ذلك ، فإن الموضوعات الأربعة المذكورة أعلاه هي أهم مهارات تطوير البرمجيات التي يجب على عالم البيانات أن يلتقطها.
للتوضيح ، ستساعدك معرفة كيفية كتابة رمز عالي الجودة بمجرد أن تقرر اختيار FastAPI لتطوير API. وبنفس الطريقة ، فإن الشعور بالراحة مع سطر الأوامر يجعل تقنيات مثل Docker أقل تخويفًا.