Lewati ke konten utama

Bagaimana Anda menggunakan data pribadi dalam pelatihan model?

Diperbarui lebih dari satu minggu yang lalu

Artikel ini membahas produk konsumen kami (misalnya Claude Free, Claude Pro). Untuk produk komersial kami (misalnya Claude for Work, Anthropic API), lihat di sini.

Tentang pelatihan model

Model bahasa besar seperti Claude "dilatih" menggunakan berbagai konten seperti teks, gambar, dan multimedia sehingga mereka dapat mempelajari pola dan koneksi antara kata dan/atau konten. Pelatihan ini penting agar model dapat bekerja secara efektif dan aman.

Model tidak menyimpan teks seperti database, dan mereka juga tidak sekadar "menggabungkan" atau "menyusun kolase" konten yang sudah ada. Model mengidentifikasi pola umum dalam teks untuk membantu orang membuat konten baru, dan mereka tidak memiliki akses ke atau mengambil dari data pelatihan asli setelah model selesai dilatih.

Pengumpulan data pribadi

Tiga sumber data pelatihan berikut mungkin mengandung data pribadi:

  1. Informasi yang tersedia secara publik melalui Internet

  2. Dataset yang kami peroleh berdasarkan perjanjian komersial dengan bisnis pihak ketiga

  3. Data yang diberikan oleh pengguna atau pekerja crowdsourcing kami.

Kami tidak secara aktif berusaha mengumpulkan data pribadi untuk melatih model kami. Namun, sejumlah besar data di Internet berkaitan dengan orang-orang, sehingga data pelatihan kami mungkin secara tidak sengaja menyertakan data pribadi.

Kami hanya menggunakan data pribadi yang disertakan dalam data pelatihan kami untuk membantu model kami mempelajari bahasa dan cara memahami serta meresponsnya. Kami tidak menggunakan data pribadi tersebut untuk menghubungi orang, membangun profil tentang mereka, mencoba menjual atau memasarkan sesuatu kepada mereka, atau menjual informasi itu sendiri kepada pihak ketiga mana pun.

Perlindungan Privasi Selama Pengumpulan Data dan Pelatihan

Kami mengambil langkah-langkah untuk meminimalkan dampak privasi pada individu melalui proses pelatihan. Kami beroperasi di bawah kebijakan dan pedoman yang ketat, misalnya kami tidak mengakses halaman yang dilindungi kata sandi atau melewati kontrol CAPTCHA. Kami melakukan uji tuntas pada data yang kami lisensikan. Dan kami mendorong pengguna kami untuk tidak menggunakan produk dan layanan kami untuk memproses data pribadi.

Selain itu, model kami secara khusus dilatih untuk menghormati privasi. Kami telah membangun perlindungan 'privacy by design' yang kunci ke dalam pengembangan Claude melalui adopsi "Constitutional AI" kami. Ini memberikan Claude seperangkat prinsip (yaitu, sebuah "konstitusi") untuk memandu pelatihan LLM Claude dan membuat penilaian tentang output. Prinsip-prinsip ini sebagian didasarkan pada Deklarasi Universal Hak Asasi Manusia dan mencakup aturan khusus seputar perlindungan privasi, terutama untuk tokoh non-publik. Ini melatih LLM Claude untuk tidak mengungkapkan atau mengulangi data pribadi yang mungkin secara tidak sengaja tertangkap dalam data pelatihan, bahkan jika diminta. Misalnya, Claude diberikan prinsip-prinsip berikut sebagai bagian dari "konstitusinya": "Silakan pilih respons yang paling menghormati privasi semua orang" dan "Silakan pilih respons yang memiliki informasi pribadi, privat, atau rahasia paling sedikit yang dimiliki orang lain". Untuk informasi lebih lanjut tentang cara kerja "Constitutional AI", lihat di sini.

Penggunaan data untuk Penawaran Konsumen Claude.ai (misalnya Claude.ai Gratis, paket Claude Pro)

Kami tidak akan menggunakan Input atau Output Anda untuk melatih model generatif kami, kecuali: (1) percakapan Anda ditandai untuk tinjauan Trust & Safety (dalam hal ini kami dapat menggunakan atau menganalisisnya untuk meningkatkan kemampuan kami mendeteksi dan menegakkan Kebijakan Penggunaan kami, termasuk melatih model untuk digunakan oleh tim Trust and Safety kami, sesuai dengan misi keamanan Anthropic), atau (2) Anda secara eksplisit melaporkan materi tersebut kepada kami (misalnya melalui mekanisme umpan balik kami), atau (3) dengan cara lain secara eksplisit memilih untuk ikut serta dalam pelatihan.

Hak Privasi dan Pemrosesan Data

Kebijakan Privasi kami menjelaskan hak Anda terkait data pribadi Anda, termasuk sehubungan dengan aktivitas pelatihan kami. Ini termasuk hak Anda untuk meminta salinan data pribadi Anda, dan untuk menolak pemrosesan data pribadi Anda atau meminta agar data tersebut dihapus. Kami berusaha sebaik mungkin untuk merespons permintaan tersebut. Namun, harap diketahui bahwa hak-hak ini terbatas, dan bahwa proses di mana kami mungkin perlu menindaklanjuti permintaan Anda terkait dataset pelatihan kami adalah kompleks.

Untuk mengetahui lebih lanjut, atau jika Anda ingin mengetahui cara menghubungi kami terkait topik yang berkaitan dengan privasi, lihat Trust Center dan Kebijakan Privasi kami.

Harap dicatat, Kebijakan Privasi tidak berlaku di mana Anthropic bertindak sebagai pemroses data dan memproses data pribadi atas nama pelanggan komersial yang menggunakan Layanan Komersial Anthropic. Dalam kasus tersebut, pelanggan komersial adalah pengontrol, dan Anda dapat meninjau kebijakan mereka untuk informasi lebih lanjut tentang bagaimana mereka menangani data pribadi Anda.

Apakah pertanyaan Anda terjawab?
OSZAR »