[LANJUTAN] PART 3 : Teknik dari Web ( The Web Engineering
3.2 Referensi & Identitas
Semantic Web mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau yang lain. Masalah dengan label di Web adalah bahwa setiap Sistem pada dasarnya desentralisasi dan tidak diawasi, sesuai dengan Prinsip-prinsip yang mengatur Web, tetapi kurangnya sentralisasi memungkinkan skema different dan Konvensi, dan memang kecerobohan, untuk flourish, yang pada gilirannya membuka kemungkinan kegagalan referensi yang unik.
3.2.1 Referensi: Ketika Apakah dua objek yang sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten Dan desentralisasi menghalangi Web membuat asumsi nama yang unik. Di sisi lain, URI menyediakan Web sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diselesaikan bahwa dua istilah yang menunjuk ke URI sama. Jadi jika "bintang pagi" dan "malam bintang" menunjuk langsung ke maka setiap grounding lebih lanjut adalah super fluous.Secara umum, manajemen referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa Web mencakup sejumlah besar informasi mengumpulkan untuk sejumlah alasan yang berbeda dan untuk memecahkan berbagai tugas; makna dan interpretasi sering berubah, dan ada mungkin pada kesempatan menjadi kesepakatan sedikit tentang referen istilah. Sebuah isu penting untuk Web Science justru bagaimana memahami referensi dan representasinya, dan untuk menentukan sistem manajemen dan formalisme akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa yang Web ini mengaku untuk mengatakan tentang yang objek.
Di sisi lain, perbedaan kedua URI mungkin merujuk kepada objek yang sama bebas yang jelas, dan dapat melakukannya melalui hanya beberapa operasi yang digunakan. Sebuah metode heuristic untuk menyelesaikan bentrokan seperti itu, di dunia nyata, adalah untuk membuat penilaian cerdas yang didasarkan pada informasi agunan, dan ini telah menirukan online oleh perhitungan komunitas praktek nama, berdasarkan jaringan sekitarnya setiap sengketa kejadian hubungan.
3.2.2 Kapan adalah dua halaman yang sama?
Sebuah halaman mengambil alternatif pada masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan sepele dalam banyak kasus, teks "utama" disalin dari satu halaman ke halaman lain, tetapi dikelilingi oleh berbagai iklan, logo, header dan footer.Mengambil masalah referensi alternatif adalah menentukan ketika halaman web dua halaman yang sama. Dasar pembuatan kesamaan penilaian tidak hanya perlu konten pada halaman, tapi bisa juga menjadi struktur hyperlink di mana halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu datang dari satu halaman, tetapi sebaliknya dapat dikumpulkan dari gugus dokumen di sekitar topik dasar, dan begitu struktur hubungan yang ada dapat menjadi sangat penting. Dan cara yang lebih lanjut pemahaman kesamaan antara pola penggunaan tertentu halaman dua halaman sering Diakses pada titik-titik yang sama dalam sesi surfing Web.
Dasar untuk membuat penilaian kemiripan tidak perlu menambah konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam yang halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan linkage struktur ada bisa sangat penting. Dan mungkin lebih jauh cara memahami kesamaan antara pola penggunaan tertentu halaman - dua halaman sering diakses pada titik-titik yang sama di Web a browser.
Kesamaan konten berbasis dapat didekati oleh pencocokan kata atau subsequences dari dua halaman. Teknik relatif sederhana dapat digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran persimpangan subsequences dan ukuran kesatuan mereka), dan penahanan satu dengan yang lain (rasio antara persimpangan dan ukuran dari set lengkap).
3.3 Web teknik: arah baru
Pengembangan Web adalah campuran dari pengaturan standar, aktivitas terstruktur, desentralisasi dan inovasi, dan disengaja rekayasa. Sebagai contoh, PageRank memerlukan merangkak dan caching significant bagian web; Keberhasilan Google tergantung pada mampu menjaga cache tractable sementara juga dari ukuran significant. Pertumbuhan Web adalah jelas sesuatu yang diinginkan. Penyimpanan jumlah yang selalu lebih besar dari informasi, dalam konteks percepatan perhitungan, akan penting bagi masa mendatang. Tanpa penyimpanan cerdas dan pengambilan lebih cepat untuk Media memori seperti video, maka akhirnya Web akan tumbuh terlalu besar untuk teknologi sendiri.Pelebaran cakupan pencarian untuk mencakup item seperti multimedia, Layanan atau komponen ontologi, juga akan membutuhkan mengejar program penelitian akademis, effective antarmuka dan model bisnis yang masuk akal, dan mengembangkan pendekatan untuk memanfaatkan Web harus diperpanjang ke lingkungan Web baru ketika mereka diciptakan (seperti jaringan P2P, misalnya).
3.3.1 Layanan Web
Layanan adalah wilayah kunci di mana model rekayasa kami dari Web butuhkan untuk terlibat dan jasa extended. Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. tugas skala besar dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan sedikit keberuntungan akan memetakan ke spesifik tugas yang dapat ditangani oleh layanan. Jika itu terjadi, dan jika layanan ditempatkan dalam konteks Web, yang berarti bahwa pengguna bisa memanggil layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka. Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan mesin komputasi dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan solusi dalam cara yang relatif intuitif.Proses algebras juga telah diterapkan ke layanan. BPEL4WS adalah versi panjang dari bisnis proses eksekusi bahasa BPEL, yang menjadi cara yang semakin penting untuk interleave layanan Web dengan proses bisnis. BPEL memiliki batas-batas, tetapi memungkinkan penciptaan komposit layanan dari layanan yang ada. Tahap berikutnya adalah untuk menyesuaikan pendekatan ini untuk lingkungan P2P, dan saat ini sedang dikembangkan untuk itu CDL, alias WS CDL, alias koreografi (Web Layanan koreografi Deskripsi bahasa), sebuah bahasa berbasis XML untuk defining komplementer dan umum perilaku diamati di P2P kolaborasi. Tujuannya adalah bahwa dioperasikan P2P kolaborasi dapat disusun menggunakan koreografi tanpa seperti specifics sebagai platform yang mendasari yang sedang digunakan; Alih-alih fokus adalah tujuan umum kolaborator. Sedangkan BPEL memungkinkan layanan-layanan existing untuk digabungkan bersama-sama, koreografi bergeser fokus ke Deskripsi global kolaborasi, pertukaran informasi, memesan tindakan dan sebagainya, untuk mencapai tujuan yang telah disepakati.
3.3.2 Didistribusikan pendekatan: merasuk komputasi, P2P dan grid
Komputasi mana-mana, P2P dan komputasi grid berbagi banyak masalah-masalah penelitian serius, terutama koordinasi perilaku dalam sistem berskala besar yang didistribusikan. Komputasi mana-mana pemerintah kecil, relatif rendah didukung perangkat komputasi tertanam dalam lingkungan pervasively berinteraksi dengan orang-orang. Misalnya, pencarian layanan di paradigma meresap harus mengambil tempat tanpa manusia dalam lingkaran. Layanan harus dapat mengiklankan diri mereka sendiri untuk memfasilitasi penemuan. Ini adalah salah satu contoh lingkungan komputasi yang sedang berkembang yang cenderung tumbuh dalam pentingnya. Dalam konteks Web Science dan mencari dan deskripsi invariants pengalaman Web, penting bahwa asumsi-asumsi yang kita buat mengenai lingkungan, dan teknologi yang hidup di dalamnya, diminimalkan jaringan P2P, ditandai dengan otonomi dari server pusat, intermiten konektivitas dan oportunistik penggunaan sumber daya, yang lain menarik lingkungan untuk generasi berikutnya Web.Untuk mendapatkan personalisasi yang efektif, ada harus diintegrasikan penggunaan informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, pola download, profil online), sumber daya yang disampaikan (konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan teknik data mining yang cukup untuk membuat pandangan menyeluruh dari sumber daya yang meliputi sebanyak informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi mereka tidak akan mau, dan yang bisa memperhitungkan dinamika sifat dari model pengguna.
3.3.3 Personalisasi
Personalisasi penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci . Recommender sistem yang jelas penerapan teknologi untuk mendapatkan effective personalisasi, harus ada terpadu penggunaan informasi dari berbagai sumber, termasuk data tentang pengguna (klik streaming, men-download data pola, online profiles), sumber daya yang disampaikan (konten situs, struktur situs) dan domain pengetahuan, bersama dengan data pertambangan teknik sufficient untuk menciptakan pandangan menyeluruh sumber daya yang mencakup banyak informasi yang dibutuhkan para pengguna.Mengingat bahwa, di Web, informasi yang relevan cenderung sangat didistribusikan dan dinamis, personalisasi diharapkan menjadi salah satu keuntungan besar dari Web semantik, yang adalah pre-nyata struktur yang memungkinkan penalaran melalui beberapa dan didistribusikan sumber data, Lain penting untai teknik personalisasi adalah pengembangan alat untuk mengaktifkan relatif neophytes untuk menciptakan atau meningkatkan artefak kompleks pengetahuan teknik, seperti ontologi atau pembungkus.
3.3.4 Multimedia
Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik - ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Sebagai contoh ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka Sana memiliki upaya untuk menghasilkan 'bahasa-seperti' taksonomi generatif representasi visual yang ,tetapi ini tidak tampaknya memiliki aplikasi menarik. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran diagram . Secara umum, tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual andal; Fenomena ini dikenal sebagai kesenjangan semantik.Infrastruktur seperti yang telah dibuat, menggunakan ontologi deskriptor visual (i) yang berdasarkan representasi RDF MPEG-7 visual deskriptor, Ontologi struktur multimedia (ii) berdasarkan skema multimedia Deskripsi MPEG-7 dan (iii) inti ontologi pemodelan primitif pada akar dari hirarki konsep yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi, Semua dilengkapi dengan domain ontologi
Tentu saja, media yang dibayangkan di sini adalah gambar dan video; pertanyaan terbuka penelitian tetap tidak hanya tentang seberapa jauh yang bisa di Cari oleh pendekatan seperti itu, tetapi juga tentang bagaimana berbagai media akan menyerah pendekatan seperti dalam cara yang integrable.
3.3.5 Pemrosesan Bahasa Alami
NLP berkaitan dengan Web dalam beberapa cara. Di tempat pertama, bahasa alami adalah sangat jarang domain, yang kebanyakan kalimat yang diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web menyediakan korpus menarik untuk NLP penalaran.Kedua, mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan dan [69]), yang dapat memberikan dukungan berguna untuk bagian manusia dari tugas Cari.
Ketiga, NLP memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan. Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai tempat mana berguna dokumen yang diperoleh.
Dengan demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari drift makna bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas sufficient atas pendek jangka menengah.
Sumber:
https://id.wikipedia.org/wiki/Web_engineering
http://lintang.staff.gunadarma.ac.id/Downloads/files/24687/WebScienceTim.pdf
No comments:
Post a Comment