purwadhika-logopurwadhika-logo

Contoh Penerapan, Tugas, Gaji, dan Definisi Data Science

Nawfal Pradana

11 August 2023

Data Science Adalah

Kamu mungkin tidak asing dengan istilah Data Science. Istilah tersebut biasanya berkaitan dengan pekerjaan mengolah data. Istilah data science memang sedang populer saat ini. Karena banyak perusahaan yang membutuhkan seorang data scientist. Tapi sebenarnya apa itu data science? Data science adalah bidang ilmu yang memanfaatkan metode, teknik, dan algoritma pengolahan data untuk diekstrak menjadi wawasan dan informasi. Karena hal tersebut akhirnya banyak perusahaan atau bisnis yang membutuhkan tenaga di bidang tersebut. Nah kalau kamu ingin tahu lebih banyak, simak artikel satu ini sampai habis.

Apa Itu Data Science?

Data science adalah ilmu multidisiplin yang menggabungkan statistika, programming, dan domain knowledge (pemahaman pada bidang bisnis tertentu) yang bertujuan untuk mengekstrak, menganalisis, dan menginterpretasikan informasi dari kumpulan data guna mendapatkan wawasan dan mendukung pengambilan keputusan Hasil prediksi dari machine learning tersebut akan digunakan untuk membuat strategi dan rencana bisnis kedepannya. Data scientist pernah dinobatkan sebagai “The sexiest job of 21st century” dari Harvard Business Review.

Tapi mungkin kamu bertanya kenapa pekerjaan ini sangat dibutuhkan?

Pentingnya Data Science untuk Bisnis

Data science sangatlah penting untuk sebuah bisnis yang baru mulai atau yang sudah besar. Jika suatu perusahaan tidak bisa mengolah data yang telah dikumpulkan, maka bisnis tersebut tidak akan punya pedoman sebagai rancangan strategi dan pengambilan keputusan kedepannya. Pada perusahaan yang baru mulai atau start-up, data science berperan penting dalam validasi ide menggunakan uji hipotesis, menemukan pasar, strategi pertumbuhan bisnis, dan lain-lain. Sedangkan pada perusahaan korporat yang sudah matang, data science dapat berperan dalam optimalisasi produk, ekspansi pasar, personalisasi, dan lain-lain. Dengan kata lain kamu akan sulit untuk mngembangkan bisnis tanpa pedoman pasti. Jadi ilmu data science ini penting untuk dimiliki oleh sebuah bisnis karena bisa mempermudah pengambilan keputusan berdasarkan data yang diterima agar semakin efisien dan efektif.

3 Komponen Utama Data Science

Seperti yang sudah disinggung sebelumnya, data science merupakan gabungan dari beberapa disiplin ilmu. Berikut ini 3 komponen utama dalam bidang ilmu data science:

  • Statistika: Statistika adalah dasar dari ilmu data science itu sendiri. Statistika adalah bidang ilmu untuk merangkum, menganalisis, dan menginterpretasi data. Di dalam statistika, akan dipelajari mengenai persebaran data, ukuran pusat data seperti rata-rata dan median, dan cara merangkum data. Selain itu, ada teknik lain seperti uji hipotesis, analisis korelasi, dan regresi, di mana seorang data scientist dapat memvalidasi asumsi, melihat hubungan antara 2 variabel, dan membuat prediksi. Oleh karena itu, seorang data scientist wajib memahami statistika.

  • Pemrograman: Data Scientist membutuhkan skill pemrograman untuk berbagai kebutuhan, mulai dari membersihkan data, visualisasi dan analisa data, membangun model machine learning, mengautomasi berbagai proses pengolahan data, dan masih banyak kegunaan lainnya. Bahasa pemograman yang paling populer diapaki oleh Data Scientist saat ini adalah python dan R.

  • Domain Knowledge: Selain perlu memahami skill teknis, Data Scientist juga perlu mamahami domain knowledge atau pemahaman pada suatu bidang bisnis tertentu. Ini diperlukan agar mereka bisa mengidentifikasi masalah bisnis yang tepat, menetukan business metric yang benar, menafsirkan data dalam konteks yang tepat, serta menghasilkan insight, solusi, dan rekomendasi bisnis yang berguna bagi stakeholder.

Tools Data Science yang Umum Digunakan

Tools Data Science yang Umum Digunakan Ketika kamu berkarir di bidang data science, kamu membutuhkan beberapa tools kerja agar mempermudah kamu dalam bekerja. Tools ini utamanya digunakan untuk data scientist, berikut ini beberapa tool wajib data science:

Looker Data Studio

Tools ini adalah produk dari google yang cocok untuk melakukan visualisasi data. Kamu bisa membuat dashboard yang interaktif dan laporan dengan visualisasi yang menarik. Selain itu hasil visualisasi data tersebut bisa kamu share dengan mudah.

MySQL

MySQL adalah sistem manajemen basis data relasional (RDBMS) yang bersifat open-source. MySQL digunakan oleh data scientist untuk berkomunikasi dengan database, mulai dari membuat, memperbarui, dan mengambil data dalam struktur tabel yang terorganisir.

Mito

Tools ini bisa digunakan untuk melakukan integrasi antara spreadsheet dan notebook Jupyter. Jadi perubahan yang dilakukan pada spreadsheet bsi mau lihat di sel kode Python. Hal ini dikarenakan Mito merupakan produk dari Python. Mito memiliki banyak fitur seperti membuat pivot tabel, analisa statistik, melakukan filter dan pengurutan data, dan masih banyak lagi.

BigML

MySQL adalah sistem manajemen basis data relasional (RDBMS) yang bersifat open-source. MySQL digunakan oleh data scientist untuk berkomunikasi dengan database, mulai dari membuat, memperbarui, dan mengambil data dalam struktur tabel yang terorganisir.

Tableau

Tableau merupakan salah satu tools yang paling populer dalam data science. Tools ini digunakan untuk keperluan business intelligence. Fungi dari software ini pun untuk membuat visualisasi interaktif, fitur unggulan dari software ini adalah kemampuan interaksi dengan data base, spreadsheet, dan Online Analytical Processing. Selain itu Tableau bisa digunakan untuk membantu bisnis perbankan dalam memonitor kinerja bisnis, transaksi nasabah, dan potensi cross selling product.

Pandas

Pandas adalah salah satu open-source library yang ada pada python. Pandas menyimpan banyak function yang dapat digunakan untuk pengolahan tabel atau dataframe, mulai dari merangkum statistik deskriptif, pengisian data yang kosong, pembuatan tabel rangkuman, penggabungan beberapa tabel, dan berbagai kegunaan manipulasi data lainnya

Contoh Penerapan Data Science

Kamu sadar tidak kalau kegiatan kita sehari-hari itu lekat dengan data science. Mungkin memang tidak langsung terasa penerapan manfaatnya, tapi segala keputusan yang diambil menggunakan data pasti sudah melewati proses pengolahan data, nah berikut ini contoh penerapan data science dalam beberapa bidang bisnis:

Bidang keuangan

Penerapan data science dalam industri financial technology (fintech) dan bank sudah sangat umum. Data Science berperan dalam segmentasi nasabah, pendeteksian penipuan (fraud dection), credit-default anlysis, dan aplikasi lainnya. Kita ambil contoh untuk penerapan dalam credit-default anlysis. Pada perusahaan yang belum merapkan data science, pengecekan apakah seorang calon kreditur (peminjam) akan diberi pinjaman atau tidak oleh perusahaan adalah berdasarkan pengecekan manual dari seorang karyawan dengan cara mengecek credit score (di Indonesia BI checking atau SLIK). Sedangkan pada perusahaan yang sudah merapkan data science, mereka akan menggunakan machine learning untuk mengklasifikasikan manakan calon peminjam yang akan lunas atau akan gagal bayar, sehingga keputusan bisini yang dilakukan akan lebih cepat dan lebih akurat.

Bidang e-commerce

Selain pada bidang keuangan, data science juga sering diimplementasikan pada bidang e-commerce. Beberapa contoh implementasinya adalah segmentasi customer dan churn prediction (memprediksi customer yang tidak lagi menggunakan produk kita). Segmentasi customer dapat digunakan dengan menggunakan analisis RFM dan yang sejenisnya ataupun dengan metode clusturing menggunakan machine learning. Pada churn prediction, data scientist biasanya akan menggunakan metode klasifikasi menggunakan machine learning.

Bidang Medis

Pada bisang medis, data scientist sering melibatkan gambar atau foto medis seperti X-ray, MRI, dan CT scan dalam melakukan analisa. Data Scientist bisa membuat model klasifikasi untuk memprediksi mana sel tumor yang ganas atau jinak. Aplikasi lainnya dalam Rekam Medis Elektronik (EMR), data scientist akan menggunakan metode NLP (Natural Language Processing) untuk emmproses teks yang kemudian akan digunakan untuk mengklasifikasi resiko penyakit tertentu.

Bidang Social Media

Kalau kamu buka explore instagram, tiktok FYP, atau home youtube, kamu pasti menyadari kalau yang ditampilkan di akun kamu dan akun teman kamu berbeda. Ini juga salah satu penerapan dari Data Science yaitu Recommendation System. Recommendation System sendiri adalah metode yang dilakukan untuk melakukan personalisasi atau penyesuaian suatu item (produk, halaman web, dll.) pada masing-masing user. Item yang direkomedasikan kepada tiap user sudah sesuai dengan behaviour-nya sendiri atau rekomedasi dari sesama user yang mirip.

Tugas dari Seorang Data Scientist

Tugas Pokok Seorang Web Developer Dalam tahap menyelesaikan permasalahan bisnis, terdapat tugas-tugas yang perlu dikerjakan oleh seorang full-stack data scientist, dimulai dari data collection, storage, preparation, analysis, prototyping & testing model, hingga model in production. Technical competencies yang perlu dipersiapkan dari seorang data scientist melibatkan 3 stacks berbeda, dimulai dari data engineer, data analyst dan data scientist. Setiap tugas ini memiliki tantangan dan resiko tersendiri dengan tingkat kesulitan yang berbeda-beda. Berikut ini adalah 6 tugas utama yang akan dihadapi oleh data scientist:

  • Data Collection: ini merupakan tugas di mana data scientist mengumpulkan data dari multiple data sources, baik dari internal perusahaan seperti transaksi customer ataupun data eksternal seperti data hasil web scraping atau membeli data dari pihak lain.

  • Data Storage: yaitu menyimpan data hasil olahan (agregasi) sementara agar bisa diproses lebih cepat. Data biasanya disimpan dalam sebuah database terintegrasi.

  • Data Preparation: data scientist akan membersihkan dan mengatur data agar nantinya bisa digunakan dalam analisis.

  • Data Analysis: dalam tugas analisis data ini, data scientist juga akan melakukan visualisasi data untuk memahami trend, distribusi, dan segmentasi dari data. Data scientist harus bisa mengambil informasi dan insight (wawasan) dari visualisasi atau analisis yang dihasilkan.

  • Prototyping & Testing Model: data scientist akan membuat model statistik atau machine learning untuk dipresentasikan kepada tim bisnis bahwa model tersebut dapat menyelesaikan masalah bisnis.

  • Model Production: data scientist juga memiliki tugas sampai memproduksi model yang telah dibuat agar dapat digunakan oleh user yang membutuhkan pemodelan tersebut. Selain itu, data scientist juga akan meng-automasi dan memantau performa model yang telah diproduksi tersebut.

Skill untuk Menjadi Data Scientist

Tugas data scientist yang telah disinggung tersebut merupakan tugas pokok jika kamu adalah seorang data scientist. Nah jika kamu ingin menjadi seorang data scientist professional. Kamu perlu memiliki skill set lain yang akan menjadikan kamu data scientist yang unggul, karena akan memudahkan pekerjaan kamu. Berikut ini skill data science yang harus kamu miliki:

Analysis

SKill pengolahan data adalah skill yang paling penting bagi seorang data scientist. Karena pekerjaan kamu akan banyak dalam analisa data mulai dari yang sedikit sampai yang banyak serta berbagai macam bentuk.

Presentasi data

Skill presentasi data sangat penting untuk seorang data scientist. Data yang dipresentasikan dengan visualisasi yang sesuai kaidah dan tujuan akan memudahkan stakeholder dalam memahami data. Data scientist juga harus memiliki skill komunikasi yang baik sehingga bisa menyampaikan hasil analisis dan rekomendasi bisnis kepasa stakeholder.

Mengoperasikan tools data science

Kemampuan dalam menggunakan tools data science adalah hal yang wajib kamu miliki, karena kamu akan menggunakan tools tersebut ketika bekerja. Jadi memiliki pengalaman yang luas tentang tools tersebut bisa memudahkan kamu dalam bekerja.

Kerja Sama Tim

Kemampuan bekerja dengan efektif dalam tim yang terdiri dari berbagai posisi, seperti data engineer, business analyst, dan product manager sangat penting dimiliki oleh data scientist karena mereka akan sering berinteraksi dengan tim dari bidang lain tersebut baik untuk kebutuhan pengambilan data maupun pemahaman bisnis.

Pengetahuan Database

Data scientist juga harus memiliki kemampuan untuk mengakses dan mengambil data dari database dengan SQL atau teknologi penyimpanan lainnya.

Rasa Ingin Tahu (Curiosity)

Data scientist harus memiliki curiosity dan critical thinking yang tinggi agar hasil analisa yang dihasilkan bisa mendalam. Mereka juga harus terus memiliki mental ingin mempelajari hal baru karena teknologi dalam bidang data science terus berkembang.

Gaji Data Scientist di Berbagai Level

Seperti yang sudah disinggung sebelumnya bahwa data scientist menjadi salah satu pekerjaan yang paling banyak dibutuhkan oleh bisnis. Maka dari itu, banyak bisnis yang rela untuk membayar mahal untuk seorang data scientist. Nah, berikut ini kisaran gaji data scientist yang ada di Indonesia. tapi perlu diketahui bahwa perbedaan gaji di bawah ini bisa terjadi karena perbedan bisnis, lokasi, tugas, dan level bekerja.

Rata - rata gaji data scientist di Indonesia:

  • Junior Data Scientist: Rp7.000.000 - Rp16.0000.0000 per bulan
  • Mid-level Data Scientist: Rp13.000.000 - Rp18.000.000 per bulan
  • Senior Data Scientist: Rp13.000.000 - Rp33.000.000 per bulan

bagikan