Belajar Machine Learning untuk Wawancara Lowongan Data Scientist

machine-learning-interview-questions

Jika kamu tertarik dengan teknologi dan sedang mencari lowongan data scientist, kemungkinan besar kamu telah mendengar tentang machine learning (pembelajaran mesin). Istilah ini memiliki suasana misteri di sekitarnya - banyak orang bingung dengan konsep ini. Namun, jika kamu mencari cara untuk menjadi AI engineer (insinyur artificial intelligence/ kecerdasan buatan) atau pengembang kecerdasan bisnis, kamu mungkin cukup akrab dengan machine learning dan segala sesuatu yang berkaitan dengannya. Namun, jika kamu benar-benar ingin mendapat pekerjaan tersebut, kamu siap dengan wawancara kerjanya. Dan adakah cara yang lebih baik untuk melakukannya daripada belajar machine learning sebagai persiapan wawancara?

Dalam tutorial ini, kita akan membahas beberapa pertanyaan wawancara paling populer tentang machine learning. Kita akan membahas hal-hal dasar dan juga lanjutan, jadi mari fokuskan pikiran dan langsung belajar machine learning kembali.

Table of Contents

Pengenalan Belajar Machine Learning

Setelah wawancara kamu dijadwalkan, kamu dapat mulai persiapan dengan belajar machine learning serta kisi-kisi pertanyaan wawancaranya. Cara terbaik untuk melakukannya adalah mulai dari pertanyaan wawancara machine learning engineer yang paling dasar.Kemungkinan besar ini adalah jenis pertanyaan pertama yang kamu termia pada awal wawancara kamu. Dengan begini, calon atasan ingin melihat apakah kamu dapat berpikir kritis dan dapat membentuk pikiran kohesif kamu sendiri. Itulah sebabnya banyak pertanyaan nantinya akan didasarkan pada definisi, perbandingan, penjelasan, dan sebagainya.

Latest Coursera Coupon Found:

Pertanyaan 1: Terangkan apa itu ‘machine learning’.

Kamu tidak berharap untuk menghindari pertanyaan ini, kan? Kalau kamu sudah mulai belajar machine learning kamu akan bisa menjawabnya.

Sebagian besar pewawancara mungkin akan menanyakan sesuatu yang mirip dengan pertanyaan ini sebagai pertanyaan pertama. Ini dilakukan karena beberapa alasan.

Pertama-tama, pertanyaan selanjutnya tentang deep learning adalah tidak begitu bermanfaat jika pewawancara kamu tidak melihat bahwa kamu benar-benar paham mengenai apa itu 'machine learning' terlebih dahulu. Selain itu, cara kamu menjawab akan menunjukkan seberapa baik kamu bisa memikirkan definisi kamu sendiri dari hasil belajar machine learning selama ini - atau, dengan kata lain, seberapa baik kamu bisa menjelaskan topik yang sulit dengan cara yang mudah dimengerti. Jika kamu hanya menghafal beberapa baris yang kamu baca dari sembarang jurnal sains ketika kamu belajar machine learning semalaman, mungkin ini akan memberi kamu kredibilitas yang lebih rendah dibandingkan dengan kemampuan untuk memikirkan cara untuk menjelaskan dengan kata-katamu sendiri.

Jadi… Apa itu machine learning?

Mungkin cara termudah dan paling dapat dipahami untuk menerangkan machine learning adalah: sebuah filosofi khusus dalam pengembangan AI (artificial intelligence/kecerdasan buatan). Ini adalah bidang ilmu/sains yang berkaitan dengan cara membuat mesin yang dapat belajar dari informasi yang diberikan kepadanya, tanpa diprogram untuk melakukan tugas tersebut sebelumnya.

Pertanyaan 2: Apa itu deep learning?

Topik deep learning adalah salah satu pertanyaan tentang pembelajaran mesin yang mungkin kamu terima selama wawancara kerja kamu. Karena deep learning sangat terkait erat dengan pembelajaran mesin, kamu mungkin bahkan mendapatkan pertanyaan campuran antara dua topik tersebut.

Deep learning adalah cabang dari pembelajaran mesin. Cabang ilmu ini berkaitan dengan pembuatan jaringan saraf mesin agar dapat menyerupai otak manusia semirip mungkin.

Pertanyaan 3: Apa bedanya error ‘tipe 1’ dan ‘tipe 2’?

Error tipe 1 mengklaim bahwa sesuatu telah terjadi ketika, pada kenyataannya, itu tidak mungkin terjadi. Error tipe 2 adalah sebaliknya - klaim bahwa tidak ada yang terjadi ketika sesuatu jelas terjadi.

Pertanyaan wawancara untuk lowongan data scientist seperti ini mungkin agak membingungkan, tetapi ada beberapa metode yang dapat kamu gunakan untuk membuatnya mudah diingat.

Misalnya, inilah metode yang mudah dalam proses belajar machine learning bagi membantu kamu untuk mengingat perbedaan antara kedua jenis error tersebut: bayangkan saja error tipe 1 adalah ketika kamu memberi tahu anjing kamu bahwa dia adalah kucing, sedangkan error tipe 2 adalah saat kamu mengatakan kepada anjing yang sama bahwa anjing tidak bisa menyalak.

Pertanyaan 4: Apa itu ‘data augmentation’?

Ini adalah salah satu pertanyaan wawancara yang lebih mudah untuk lowongan data scientist, data augmentation adalah cara memodifikasi dan membuat data baru dari yang lama. Cara ini dilakukan dengan meninggalkan target seperti sedia kala atau mengubahnya menjadi sesuatu yang sudah diketahui.

Pertanyaan 5: Mengapa ‘naive Bayes’ dinamakan seperti itu?

Naive Bayes dinamakan naive (naif) karena cara berpikirnya. Ia membuat asumsi bahwa setiap elemen dalam set data adalah sama dalam aspek kepentingan mereka. Tak diragukan lagi, ini hampir tidak pernah terjadi dalam skenario sehari-hari.

Pertanyaan 6: Mana yang lebih baik – deep network atau shallow network?

Kamu dapat mengklasifikasikan ini sebagai pertanyaan perbandingan dalam proses belajar machine learning untuk persiapan wawancara, karena kamu harus tahu sedikit tentang kedua jenis network (jaringan) ini dan juga dapat membandingkannya untuk menemukan perbedaan yang jelas.

Deep network (jaringan yang dalam; sedangkan shallow network berarti jaringan yang dangkal) biasanya dianggap sebagai alternatif yang lebih baik. Ini karena ia terdiri dari lebih banyak lapisan, yang sebagian besar tersembunyi - ini membantu jaringan dalam mengekstraksi dan membangun fitur-fitur yang lebih baik.

Pertanyaan 7: Apa itu ‘Fourier transform’?

Metode ‘Fourier transform’ digunakan untuk mengubah fungsi generik yang sederhana menjadi apa yang dikenal sebagai fungsi super (superfunction). Jika ini adalah salah satu pertanyaan wawancara machine learning engineer yang ingin kamu kembangkan sedikit lebih banyak, kamu dapat membandingkannya dengan situasi di mana kamu diberikan mobil untuk membongkarnya dan melihat semua komponen dan bagian yang berbeda dari mobil tersebut.

Pertanyaan 8: Apa itu ‘convolutional network’?

Jaringan normal dan sederhana menggunakan lapisan yang terhubung untuk melakukan berbagai proses. Sedangkan convolutional network adalah jaringan yang, alih-alih menggunakan lapisan yang terhubung, menggunakan lapisan-lapisan yang melilit .

Alasan utama mengapa orang lebih suka menggunakan convolutional network dibandingkan yang standar (lapisan-lapisan yang terhubung) adalah convolutional network memiliki jumlah parameter yang jauh lebih kecil yang dikaitkan dengan mereka.

Pertanyaan 9: Apa yang perlu kita ketahui tentang korelasi antara ‘True Positive Rate’ dan ‘Recall’?

Meskipun ini terdengar seperti salah satu pertanyaan wawancara machine learning engineer tingkat lanjutan, jawabannya sebenarnya cukup sederhana (kalau kamu belajar machine learning dengan seksama!). Kedua metrik ini sama secara identik. Kita dapat melihat ini dengan melihat formula mereka: TP / TP + FN.

Pertanyaan 10: Apa itu ‘backpropagation’?

Sebuah istilah yang terdengar canggih, backpropagation adalah sebuah metode pelatihan untuk jaringan saraf (neural network) berlapis-lapis. Kita melatih jaringan dengan metode ini dengan mengambil 'error' dari bagian paling akhir dan menempatkannya di dalam setiap bobot dalam jaringan. Dengan begini, mesin memiliki kesempatan untuk mengaplikasikan komputasinya secara efektif.

Pertanyaan 11: Apa yang akan terjadi jika kita hanya menggunakan sebuah ‘validation set’, tanpa menerapkan ‘test set’?

Karena ini adalah pertanyaan tingkat dasar terakhir dalam proses belajar machine learning sebagai persiapan wawancara AI engineer, maka tingkat kesulitannya pun lebih tinggi.

Pada dasarnya, jika kamu hanya menerapkan validation set, ini tidak akan memberikan perkiraan yang akurat dari semua pengukuran model yang kamu coba uji. Ini karena 'test set' digunakan untuk menguji bagaimana model akan melakukan contoh yang belum ditemui sampai saat itu. Jadi, jika kamu menghapus test set, kamu secara otomatis menyingkirkan kemungkinan hasil tes yang valid, kurang lebih.

Pertanyaan Wawancara Machine Learning Tingkat Lanjutan

machine-learning-interview-questions

Sekarang setelah kamu memiliki gambaran yang bagus tentang pembelajaran mesin secara umum dan jenis pertanyaan wawancara tingkat dasar tentang apa itu deep learning dan materi AI engineer secara garis besar, kita dapat beralih ke tingkat kesulitan yang lebih tinggi.

Namun, jangan cemas. Calon atasan kamu kemungkinan besar tidak akan meminta kamu untuk membangun sistem AI yang mandiri atau menulis buku sepanjang tiga ratus halaman tentang semua cara berbeda dalam belajar machine learning. Maksud saya dengan tingkat kesulitan lebih tinggi adalah pertanyaan-pertanyaannya akan sedikit lebih sulit - kamu mungkin akan diminta untuk memberikan penjelasan lebih lanjut untuk jawaban kamu, memberikan contoh, dll. Jadi jangan khawatir, santai dan mari kita langsung terjun ke pembahasan.

Pertanyaan 1: Apa perbedaan antara model ‘generative’ dan ‘discriminative’?

Meskipun mungkin terdengar seperti salah satu pertanyaan jebakan, calon atasan kamu kemungkinan besar hanya ingin tahu seberapa besar hasil belajar machine learning yang kamu lakukan dan bagaimana model ini menangani data.

Model generative, sesuai namanya, akan berupaya dan mempelajari berbagai kategori data yang disediakan untuknya. Sedangkan, model discriminative hanya akan mempelajari perbedaan antara berbagai kategori data.

Para pengembang (developer) dan insinyur (engineer) biasanya lebih suka menggunakan model discriminative, karena cenderung menangani tugas lebih cepat dan efisien.

Pertanyaan 2: Jelaskan perbedaan antara ‘cross-validation’ dan ‘stratified cross-validation’.

Cross validation (validasi silang) yang sederhana digunakan untuk memisahkan data secara acak antara periode pelatihan dan validation set (set validasi). Stratified cross validation (validasi silang bertingkat) melakukan hal yang persis sama, tetapi tanpa variabel acak - ia melacak dan melestarikan rasio pelatihan vs pengujian validasi. Ini adalah salah satu pertanyaan wawancara pembelajaran mesin yang mungkin mudah tertukar. Dengan belajar machine learning di sini kamu akan bisa untuk  lebih peka terhadap perbedaannya!

Pertanyaan 3: Dalam situasi apa kamu harus menggunakan regresi ‘Lasso’ dan ‘Ridge’?

Ini termasuk dalam kategori pertanyaan wawancara AI engineer yang  canggih terutama karena kamu memang perlu belajar machine learning secara mendalam tentang kedua jenis regresi ini untuk memberikan jawaban yang valid.

Regresi Lasso dapat melakukan dua fungsi yaitu memilih variabel dan mengecilkan parameter, sedangkan regresi Ridge hanya dapat digunakan untuk yang terakhir. Dengan demikian, kamu kemungkinan besar akan menggunakan regresi Lasso ketika kamu hanya memiliki beberapa variabel dan efek yang besar. Sedangkan, regresi Ridge patut digunakan ketika ada banyak variabel kecil.

Ini adalah contoh yang bagus dari pertanyaan wawancara tentang pembelajaran mesin yang jawabannya dapat kamu kembangkan, ketimbang hanya memberikan jawaban singkat biasa.

Pertanyaan 4: Apa itu ‘F1’?

Tidak, ia bukan kunci di keyboard kamu yang bisa kamu ditekan untuk mengeluarkan jawabannya.

Skor F1 adalah ukuran seberapa baik kinerja model kamu. Berapapun nilai yang dekat dengan '1' itu bagus, sedangkan nilai yang berada di bawah '0,5' harus diperbaiki.

Pertanyaan 5: Manakah yang lebih sering mempunyai skor yang lebih tinggi - model ensemble atau individual?

Ensemble biasanya memberikan skor lebih besar. Ini karena ia adalah kombinasi dari berbagai model yang berbeda, dibuat untuk memprediksi suatu hasil tertentu. Semakin banyak model, semakin banyak kesalahan yang dapat mereka pilah - semakin baik skor prediksi akhirnya.

Pertanyaan 6: Apa perbedaan antara ‘correlation’ dan ‘covariance’?

Ini akan menjadi salah satu pertanyaan wawancara machine learning yang canggih hanya jika kamu tidak tahu bagaimana keduanya berkorelasi (tidak ada maksud untuk mengelirukan dengan ‘correlation’).

Namun, jika kamu sudah tahu karena telah belajar machine learning secara menyeluruh, maka jawabannya cukup sederhana: covariance menjadi correlation setelah distandarisasi.

Pertanyaan 7: Jelaskan sebuah ‘imbalanced dataset’.

Sebuah imbalanced dataset (dataset yang tidak seimbang) adalah suatu set yang, setelah pengujian, mengembalikan hasil yang lebih dari setengah dari seluruh informasi ditempatkan hanya dalam satu kelas.

Bagaimana kamu bisa menghindari ini? Nah, ada beberapa solusi sederhana - melakukan tes lagi menggunakan algoritma yang berbeda atau mencoba untuk menguji jumlah data yang lebih besar sehingga hasilnya akan seimbang.

Pertanyaan 8: Apa itu ‘data normalization’?

Ingat ketika kita berbicara tentang 'backpropagation'? Nah, data normalization (normalisasi data) digunakan untuk meminimalkan redundansi (pengulangan) data dalam proses backpropagation. Hal ini memungkinkan pengguna untuk mengubah nilai yang berbeda sesuai keinginannya, sehingga menghilangkan kemungkinan masalah redundansi.

Pertanyaan 9: Dapatkah kamu menangkap korelasi antara variabel categorical dan continuous?

Ya, kamu bisa, namun kamu harus menggunakan sesuatu yang dinamakan sebagai metode Analysis of Covariance (ANCOVA). Dengan menggunakan ini, kamu dapat menangkap korelasinya.

Pros
  • Professional service
  • Flexible timetables
  • A variety of features to choose from
Main Features
  • Professional certificates
  • University-level courses
  • Online degree programs
Pros
  • Easy to use
  • Offers quality content
  • Very transparent with their pricing
Main Features
  • Free certificates of completion
  • Focused on data science skills
  • Flexible learning timetable
Pros
  • Simplistic design (no unnecessary information)
  • Good quality of courses (even the free ones)
  • A few different features to choose from
Main Features
  • Nanodegree Program
  • Suitable for enterprises
  • Paid Certificates of completion

Pertanyaan 10: Untuk apa fungsi activation digunakan?

Fungsi ini membolehkan kamu untuk mendiversifikasikan networkmu dengan mengenalkan metode pembelajaran non-linear. Apa yang akan dilakukannya adalah ini akan menolong mesinmu untuk belajar cara memproses proses-proses yang sulit dengan cara yang lebih mudah.

Kesimpulan Belajar Machine Learning

machine-learning-interview-questions

Dalam tutorial ini, kami melihat berbagai pertanyaan wawancara tentang pembelajaran mesin. Kita telah memulai dengan dasar-dasarnya, dan kemudian membahas beberapa pertanyaan dan jawaban wawancara pembelajaran mesin yang lebih canggih yang mungkin kamu terima selama wawancara kerja kamu.

Baik kamu mencari pekerjaan sebagai spesialis IT atau ahli AI pembelajaran mesin, lakukan yang terbaik dalam merevisi dan mengingat pertanyaan dan jawaban wawancara pembelajaran mesin ini. Tentu saja, kita bagaikan baru menyentuh ujung gunung es, tetapi jika kamu mempelajari pertanyaan-pertanyaan ini dan jawabannya, kamu setidaknya sudah mempunyai gambaran umum tentang apa yang dapat kamu ekspektasikan dari wawancara untuk lowongan data scientist nanti..

Jadi, kita telah mencapai akhir tutorial “Belajar Machine Learning untuk Persiapan Wawancara Lowongan Data Scientist” ini. Saya berharap bahwa informasi ini akan berguna bagi kamu dalam memperoleh pekerjaan impianmu. Semoga berhasil!

Leave your honest feedback

Leave your genuine opinion & help thousands of people to choose the best online learning platform. All feedback, either positive or negative, are accepted as long as they’re honest. We do not publish biased feedback or spam. So if you want to share your experience, opinion or give advice - the scene is yours!

FAQ

How do you choose which online course sites to review?

We pick online learning platforms according to their market size, popularity, and, most importantly, our users’ request or general interest to read genuine MOOC reviews about certain online learning platforms.

How much research do you do before writing your e-learning reviews?

Our dedicated MOOC experts carry out research for weeks – only then can they say their evaluations for different aspects are final and complete. Even though it takes a lot of time, this is the only way we can guarantee that all the essential features of online learning platforms are tried and tested, and the verdict is based on real data.

Which aspect is the most important when choosing the best online learning platforms?

It wouldn’t be right to pick just one aspect out of the selection: priorities depend on each individual person, their values, wishes, and goals. A feature that’s important to one person can be utterly irrelevant to the other. Anyhow, all users would agree that good quality of the learning material is a must for online learning platforms.

How is this e-learning review platform different from others?

Every MOOC-reviewing platform is unique and has its own goals and values. Our e-learning reviews are 100% genuine and written after performing a careful analysis. That is the goal that a lot of e-learning review sites lack, so we consider it to be our superpower!

Days
Hours
Minutes
Seconds