Kata extractio , dari bahasa Latin abad pertengahan, berasal dari bahasa kita dalam pengekstrakan. Istilah ini merujuk kepada perbuatan dan akibat pengekstrakan: penghapusan, pemadaman, penghapusan.
Contohnya: "Doktor gigi memberitahu saya bahawa, dua jam sebelum pencabutan gigi, saya harus mengambil antibiotik untuk mengelakkan jangkitan" , "Pengekstrakan kerang dilarang kerana ia adalah haiwan yang berisiko pupus" , " Ahli persekitaran memastikan bahawa pengambilan emas akan menghancurkan gunung dan menyebabkan kerosakan yang tidak dapat dipulihkan kepada ekosistem . ”
Kita dapat mencari pelbagai jenis pengekstrakan di pelbagai kawasan. Apabila seseorang menghampiri mesin juruwang automatik (ATM), mereka dapat membuat pengeluaran dan mengeluarkan wang dari akaun bank mereka, dengan mengambil bil yang diberikan mesin tersebut.
The pengekstrakan darah, di sisi lain, adalah satu prosedur yang dijalankan dalam bidang kejururawatan. Dengan mengambil darah dari pesakit, sampel dapat dianalisis dan maklumat berharga tentang kesihatan individu dapat diperoleh.
Dalam konteks pergigian, pengekstrakan adalah pembedahan yang melibatkan pencabutan gigi atau sebahagiannya. Dalam kerangka ini, doktor gigi menggunakan instrumen tertentu dan menggunakan pengetahuan dan kemahiran mereka untuk mencapai objektif.
Berfokus pada pengkomputeran, pengekstrakan maklumat adalah operasi yang dikembangkan untuk mengambil kandungan dari pangkalan data. Prosesnya dapat ditentukan secara automatik jika maklumat tersebut disusun.
Pengambilan maklumat berstruktur atau separa berstruktur adalah sebahagian daripada tugas pemulihan, dan dilakukan dengan menggunakan dokumen yang dapat dibaca oleh komputer. Sebagai contoh, proses ini berlaku apabila dokumen tulisan tangan tertentu diimbas untuk menafsirkan data mereka dan membawanya ke pangkalan data digital; iaitu, mesti ada aplikasi yang mengenali teks dan mengubahnya menjadi maklumat yang dapat disimpan dan diedit, bukan hanya membiarkannya dalam format grafik.
Bentuk teks bervariasi sesuai dengan proyek dan niat mereka yang melakukan pengekstrakan maklumat: dalam beberapa kes, bentuknya tersusun, yang cenderung dibuat oleh syarikat itu sendiri yang cuba mengekstrak maklumat di dalamnya setelah telah diisi oleh pihak ketiga; tetapi juga dapat berupa teks yang tidak terstruktur, seperti artikel surat khabar atau buku fiksyen.
Di sini konsep bahasa semula jadi dimainkan, yang merujuk kepada ragam linguistik khas manusia yang diciptakan dengan objektif untuk berkomunikasi dan disokong oleh sintaksis tertentu dan mematuhi prinsip-prinsip optimisme dan ekonomi bahasa. Sumber teks yang boleh digunakan untuk pengekstrakan maklumat mesti mengandungi mesej yang ditulis dalam bahasa jenis ini.
Antara tugas pengekstrakan maklumat yang paling biasa adalah seperti berikut:
* pengenalan nama: sama ada nama seseorang, syarikat atau tempat, atau bahkan nilai wang atau ungkapan lain yang termasuk dalam kategori yang telah ditentukan, pengekstrakan maklumat digunakan untuk mencari dan mengklasifikasikannya;* penyelesaian rujukan bersama: ini berkaitan dengan pengesanan rujukan bersama antara entiti dokumen tertentu, seperti yang terdapat di antara nama penuh syarikat dan akronimnya;
* Pengekstrakan terminologi: dalam hal ini, proses terdiri dari analisis teks untuk mengenal pasti argumen semantik yang terkait dengan kata kerja, untuk membuat klasifikasi mengikut peranannya. Contohnya, dalam kalimat "Marisa membeli PDA dari Valeria" , "Marisa" diakui sebagai agen beli , "PDA" adalah objek , "dibeli" adalah kata kerja dan "Valeria" adalah ejen penjualan .
Dalam perlombongan, akhirnya, pengekstrakan adalah aktiviti yang memungkinkan untuk mendapatkan deposit mineral kemudian dieksploitasi secara komersial: pengekstrakan tembaga, pengekstrakan litium, dll.