purwadhika-logopurwadhika-logo

Data Modeling adalah: Fungsi Bagi Data Scientist

Jean Sundego

04 July 2023

Data Modeling adalah Fungsi Bagi Data Scientist

Data modeling adalah salah satu keahlian yang dibutuhkan jika kalian ingin menjadi seorang Data Scientist. Karena, bagi data scientist, keahlian ini berguna, diperlukan dan diterapkan di suatu perusahaan. Data modeling adalah proses pembuatan representasi visual dari seluruh sistem informasi atau bagiannya untuk berkomunikasi membentuk koneksi antar poin data dan struktur.

Hal ini berguna untuk mengetahui dimana data disimpan untuk mempermudah komunikasi antara tim dan manajemen data, dan sangat berguna jika suatu perusahaan memiliki jumlah data yang banyak. Data modeling akan memperjelas data yang akan digunakan dan apa yang dilakukan terhadap data tersebut untuk keperluan bisnis atau tidak.

Secara umum, data modeling adalah menciptakan suatu metode untuk menyimpan informasi dalam bentuk yang efisien dan pengguna dapat mengakses data dengan lebih mudah. Data scientist harus mempunyai pikiran sistematis untuk menemukan poin dari data yang diambil dan disimpan kedalam bentuk data modeling.

Fungsi Data Modeling

Data modeling memiliki beberapa fungsi yang berguna terutama bagi seorang data scientist. Fungsi-fungsi ini dapat membantu pekerjaan mereka dalam urusan data terutama data-data besar.

Manajemen Data

Fungsi pertama dari data modeling adalah manajemen sebuah data. Dengan memanfaatkan data modeling, seluruh tim dipermudah dalam pengaksesan beberapa data yang dimiliki. Hal ini didasari oleh pengetahuan dimana data yang dimiliki disimpan, sehingga anggota tim dapat mengakses data tersebut pada waktu tertentu.

Penghematan Biaya

Manfaat lainnya dari data modeling adalah penghematan biaya bagi perusahaan. Meskipun begitu, memanfaatkan data modeling agar biaya menjadi lebih hemat bukanlah hal yang mudah. Berdasarkan data dari Cloverdx, pemanfaatan data modeling data menurunkan biaya pada bidang IT terutama pemrograman sampai dengan 75%.

Bukan tanpa alasan, ini dikarenakan dengan data modeling, error yang terjadi pada saat tahapan awal dapat diketahui dan dengan mudah diperbaiki. Tetapi, jika eror sudah terjadi saat software sudah dalam pengembangan, penulisan, atau bahkan sudah dipakai oleh user akan lebih sulit untuk diperbaiki dan membutuhkan biaya yang lebih besar.

Mengurangi risiko dan kerumitan(H3)

Semakin berkembangnya sebuah perusahaan berarti data yang dimiliki juga akan semakin banyak dan memiliki kemungkinan semakin rumit mengakses data yang ada. Oleh karena itu, fungsi lain dari modeling adalah dapat mengurangi risiko dan kerumitan tersebut. Semakin banyak data yang ada, semakin sulit integrasi antar tim untuk mengakses data tersebut.

Dengan adanya data modeling, kerumitan yang disebabkan oleh hal tersebut dapat berkurang bagi perusahaan. Hasil yang didapat adalah perusahaan dapat terus berkembang dengan integrasi yang baik antar tim melalui data modeling.

Terjadinya Kolaborasi

Manfaat lainnya dari data modeling adalah komunikasi yang terjadi antar tim, terutama tim IT dengan tim atau staf nonteknis menjadi lebih mudah. Hal ini terjadi karena data modeling dapat mempermudah dan memperjelas mengenai perkembangan bisnis yang terjadi dan penggunaan data dalam bisnis dilengkapi dengan cara yang mudah dipahami oleh semua staf.

Berbagai Tahapan Data Modeling

Terdapat berbagai tahapan data modeling yang ada dengan jenis layout yang berbeda-beda juga. Menurut data dari SAP, terdapat tiga tingkatan atau jenis dari data modeling. Dimulai dari konseptual, logis, dan juga fisikal.

Konseptual Data Model

Data model tahap ini adalah gambaran besar dari model yang menampilkan struktur secara keseluruhan tapi tidak dengan data plan secara detail. Tipikal pin awal dari jenis model ini adalah mengidentifikasi berbagai set data dana aliran data dalam organisasi. Konseptual data model adalah blueprint tingkat tinggi untuk mengembangan model logis dan fisikal, dan ini adalah bagian penting dari dokumentasi arsitektur data.

Biasanya yang membuat model ini adalah pemangku kepentingan bisnis dan arsitektur data. Hal ini bertujuan untuk memperluas, mengatur, dan mendefinisikan konsep dan aturan bisnis.

Logis Data Model

Selanjutnya adalah logis data model. tahap ini adalah yang paling dekat dengan definisi dari data model itu sendiri. Model ini digunakan untuk menjelaskan dan menjelaskan bagaimana sebuah sistem dapat dilaksanakan terlepas dari database management system (DBMS). Tujuan dari jenis ini untuk mengembangkan peta tenis dari struktur data dan peraturan. Biasanya model ini digunakan oleh business analyst dan arsitek data.

Fisikal Data Model

Pada tahapan ini menjelaskan secara spesifik bagaimana model logis akan di realisasikan. Model ini harus berisi cukup data yang berguna bagi teknologis untuk membuat struktur database secara aktual pada hardware dan software untuk mendukung aplikasi yang akan digunakan. Fisikal data model biasanya digunakan secara spesifik untuk perangkat lunak sistem database.

Jenis-Jenis Data Modeling

Jenis-Jenis Data Modeling Terdapat tiga jenis data modeling utama yang biasa digunakan. Dimulai dari Relational, Dimensional, dan juga Entity Relationship (E-R).

Relational Data Modeling

Data model jenis ini dibuat agar bersifat fleksibel untuk menghubungkan data dengan cara mengelompokkan data-data yang ada kedalam tabel yang terdiri dari baris dan kolom. Model data ini menggunakan bahasa query terstruktur dan SQL untuk manajemen data sehingga dapat digunakan secara mudah. Perlu diketahui, Relational data modeling masih digunakan hingga saat ini.

Dimensional Data Modeling

Jenis data ini digunakan tak hanya untuk penyimpanan yang lebih efisien, tetapi juga memberikan kemudahan akses bagi user untuk mengakses data yang ada dengan lebih cepat. Oleh karena itu, model data ini biasanya digunakan sebagai pusat penyimpanan data (data warehouse) dan juga data mart sebagai tempat penyimpanan data yang lebih khusus.

Terdiri dari tabel fakta dan tabel dimensi yang meletakkan atribut entitas di dalam tabel fakta adalah hal yang membentuk dimensional data modeling ini. Selain itu, terdapat beberapa jenis dari dimensional data modeling, dua diantaranya cukup populer.

Star Schema: Skema ini menyusun data menjadi sebuah fakta (item terukur) dan dimensi (atribut). Pola yang dimiliki oleh skema ini menghubungkan tabel fakta sebagai pusat yang bercabang ke berbagai tabel dimensi. Oleh sebab itu jenis ini terlihat seperti bintang.

Snowflake Schema: Skema ini adalah bentuk tambahan dari star schema dimana beberapa tingkat tabel dimensi dimiliki oleh skema ini sehingga bentuknya lebih kompleks, seperti bentuk snowflake.


bagikan