Pelajari cara menyiapkan Cursor untuk workflow data science mencakup Python, R, dan SQL dengan notebook, environment remote, dan analisis bertenaga AI
Cursor menyediakan alat terintegrasi untuk pengembangan data science melalui lingkungan yang dapat direplikasi, dukungan notebook, dan bantuan kode berbasis AI. Panduan ini membahas pola penyiapan penting untuk alur kerja Python, R, dan SQL.
Untuk dukungan notebook lengkap, unduh ekstensi Jupyter (id: ms-toolsai.jupyter) yang dipublikasikan oleh ms-toolsai.
Cursor mendukung file .ipynb dan .py dengan eksekusi sel terintegrasi. Tab, Inline Edit, dan Agent
berfungsi di dalam notebook, sama seperti di file kode lainnya.Kemampuan utama:
Eksekusi sel inline menjalankan kode langsung di dalam antarmuka editor
Tab, Inline Edit, dan Agent semuanya memahami pustaka data science termasuk pandas, NumPy, scikit-learn, dan perintah SQL magic
Server MCP memungkinkan agent lo buat ngejalanin kueri langsung ke database lo. Ini bikin agent lo bisa milih buat ngekueri database lo, nulis kueri yang sesuai, ngejalanin perintah, dan nganalisis output, semuanya sebagai bagian dari task yang lagi berjalan.Misalnya, lo bisa nyambungin database Postgres ke instance Cursor lo dengan nambahin konfigurasi MCP berikut ke Cursor:
Install ekstensi khusus database (PostgreSQL, BigQuery, SQLite, Snowflake) buat ngejalanin query langsung dari editor. Ini ngilangin context switching antar alat dan bikin AI bisa bantu ngeoptimalin query.
Copy
Ask AI
-- Cursor ngasih saran buat indeks, window function, dan optimasi kueriSELECT user_id, event_type, COUNT(*) as jumlah_event, RANK() OVER (PARTITION BY user_id ORDER BY COUNT(*) DESC) as peringkat_frekuensiFROM eventsWHERE created_at >= NOW() - INTERVAL '7 hari'GROUP BY user_id, event_type;
Gunakan Agents untuk menganalisis query yang lambat, ngasih saran peningkatan performa, atau ngehasilin kode visualisasi buat hasil query. Cursor paham konteks SQL dan bisa ngerekomendasiin tipe chart yang pas berdasarkan struktur data lo.
Bantuan AI dari Cursor mencakup pustaka visualisasi data seperti Matplotlib, Plotly, dan Seaborn. Agen bisa ngasilin kode buat visualisasi data, bantu lo eksplor data dengan cepat dan mudah, sambil bikin artefak yang bisa direplikasi dan dibagikan.
Copy
Ask AI
import plotly.express as pximport pandas as pd# AI menyarankan jenis plot yang relevan berdasarkan kolom datadf = pd.read_csv('sales_data.csv')fig = px.scatter(df, x='advertising_spend', y='revenue', color='region', size='customer_count', title='Pendapatan vs Pengeluaran Iklan per Wilayah')fig.show()
Bisa pakai Jupyter notebook yang sudah ada?
Bisa, Cursor bisa membuka file .ipynb dengan eksekusi sel penuh dan dukungan AI completion.Gimana cara menangani dataset besar yang nggak muat di memori?
Pakai library komputasi terdistribusi seperti Dask, atau sambungkan ke cluster Spark lewat koneksi Remote-SSH ke mesin yang lebih besar.Apakah Cursor mendukung file R dan SQL?
Ya, Cursor menyediakan bantuan AI dan penyorotan sintaks untuk skrip R (.R) dan file SQL (.sql).Apa cara yang direkomendasikan buat berbagi environment pengembangan?
Commit folder .devcontainer ke version control. Anggota tim bisa membangun ulang environment secara otomatis saat membuka proyek.Gimana cara nge-debug data processing pipeline?
Pakai debugger terintegrasi Cursor dengan breakpoint di skrip Python, atau manfaatkan Agent buat menganalisis dan ngejelasin transformasi data yang kompleks langkah demi langkah.
Container pengembangan bantu kamu memastikan runtime dan dependensi tetap konsisten di seluruh anggota tim dan lingkungan deployment. Ini bisa menghilangkan bug yang spesifik terhadap lingkungan dan mengurangi waktu onboarding anggota tim baru.Untuk pakai container pengembangan, mulai dengan membuat folder .devcontainer di root repository kamu. Selanjutnya, buat file devcontainer.json, Dockerfile, dan requirements.txt.
# requirements.txtpandas==2.3.0numpy# tambahkan dependensi lain yang kamu butuhkan untuk proyekmu
Cursor bakal otomatis mendeteksi devcontainer dan nge-prompt lo buat buka ulang project lo di dalam container. Atau, lo bisa buka ulang manual di container via Command Palette (Ctrl+Shift+P) dan cari Reopen in Container.Development container ngasih beberapa keuntungan:
Isolasi dependency mencegah konflik antaproject
Build yang dapat direproduksi memastikan perilaku konsisten di seluruh environment development dan production
Onboarding yang simpel bikin anggota tim baru bisa langsung mulai tanpa setup manual
Kalau analisis lo butuh resource komputasi tambahan, GPU, atau akses ke dataset privat, sambung ke mesin remote sambil tetap ngejaga environment development lokal lo.
Sediain instance cloud atau akses server on‑premises dengan resource yang diperlukan
Clone repository lo ke mesin remote, termasuk konfigurasi .devcontainer
Connect lewat Cursor: Ctrl+Shift+P → “Remote-SSH: Connect to Host”
Pendekatan ini ngejaga tooling tetap konsisten sambil ngescaled up/down resource komputasi sesuai kebutuhan. Konfigurasi development container yang sama jalan di environment lokal maupun remote.