Melanjutkan proyek pribadi saya, Kalamangga.Com, dengan tertatih-tatih dengan meluangkan 30 menit sampai 1 jam sehari sejak beberapa hari yang lalu hanya sekedar untuk merenung dan berpikir akhirnya ada sedikit perubahan yang bisa saya implementasikan.
Setelah desain infrastruktur terpenuhi dengan penambahan mesin virtual, beberapa hari yang lalu saya mulai merapikan tampilan. Perubahan yang saya lakukan meliputi pemilihan warna dan desain tata letak. Dan sesuai fokus saya mengenai pengumpulan berita dari media massa daring yang berupa teks saya belum menambahkan grafik apapun.
Dari segi fitur, saya menambahkan menu dan kata-kata yang menjadi tren pada beberapa waktu terakhir pada sisi kiri. Penambahan fitur ini sejalan dengan rencana awal saya mengenai kebutuhan akan catatan berita dari segala sumber terutama urutan waktu.
Dengan perubahan ini saya merasa cukup untuk merubah status pengembangan ini menjadi kandidat 1.
Sebagai pusat pengumpulan berita, Kalamangga.Com wajib menjalankan sinkronisasi berita secara berkelanjutan. Semua berita diharapkan sesegera mungkin bisa diambil dari sumber berita.
Kebutuhan akan pemutakhiran data yang berkelanjutan membuat saya memberanikan diri untuk menyewa sebuah mesin virtual. Tidak ada yg spesial di mesin ini karena memang tugasnya menggantikan mesin saya di rumah untuk menjalankan proses sinkronisasi.
Dalam kegunaannya di masa datang mungkin fungsi dari VPS ini juga akan membantu pekerjaan saya sehari hari mengingat besarnya ruang penyimpanan yang cukup lumayan.
Sekedar mengisi kekosongan, saya akan mengembangkan sebuah portal berita di bawah Kalamangga.Com yang nantinya berisikan liputan khusus yang berhasil dihimpun oleh redaksi.
Saat ini portal tersebut masih dalam tahap percobaan.
Mesin penggeraknya masih menggunakan peralatan favorit saya, wordpress.
Dalam minggu ini mesin infrastruktur akan kembali dijalankan dengan beberapa perubahan.
Pagi ini saya mencoba untuk melanjutkan riset pengembangan Kalamangga.Com. Kali ini riset saya mengarah kepada otomatisasi parsing berkas HTML agar menjadi text biasa.
Riset saya ini menggunakan berkas html yang saya ambil dari salah satu berita di situs detik dan saya simpan dan beri nama “xx.html”. Bahasa pemrograman dalam riset ini adalah Perl. Dan tujuan riset ini adalah membuat sebuah aplikasi parsing sederhana.
Aplikasi ini nantinya adalah bagian dari sistem infrastruktur.
Berikut kode sementara yang telah saya susun :
#!/usr/bin/perl
# Modul yang digunakan
use strict;
use warnings;
use HTML::TokeParser::Simple;
use HTML::Parse;
use HTML::FormatText;# Pakai berkas “xx.html”
my $parser = HTML::TokeParser::Simple->new(“xx.html”);# Cari tag “div”
while ( my $div = $parser->get_tag(‘div’) ) {# Cari “id” = “isiberita”
my $id = $div->get_attr(‘id’);
next unless defined($id) and $id eq ‘isiberita’;
my $hasil = $parser->get_trimmed_text(”);# Ubah ke teks
my $hasil_text = HTML::FormatText->new->format(parse_html($hasil));# Cetak hasil
print $hasil_text.”\n”;
};
NB : Aplikasi ini masih dalam tahap pengembangan. Segala hal yang terjadi akibat menjalankan aplikasi ini diluar tanggung jawab saya.
Untuk sementara waktu sinkronisasi berita Kalamangga.Com saya hentikan. Banyak hal perlu saya periksa dan teliti untuk pengembangan lebih lanjut dan rilis berikutnya.
Berita terakhir yang terpajang di sana adalah per 16 November 2011 dengan jumlah total berita 45,735.
Semoga saya bisa lebih berkonsentrasi untuk pengembangan lebih lanjut.
Berikut saya akan menjabarkan sedikit tentang pengembangan situs portal berita Kalamangga.Com.
Portal ini saya bangun dengan menggunakan perangkat apache + php5 + mysql yang berjalan di atas windows xp. Pada awalnya semua standar, perubahan dilakukan saat pengembangan Alpha3 dan munculnya niat kolaborasi dengan github.
Akhirnya dengan tidak mengurangkan fungsi windows xp, saya melakukan instalasi cygwin dengan paket git serta paket kebutuhan jaringan standar lainnya berikut perl dan python. Saya masing memilah mana yang lebih mudah agar bisa dipakai dalam mem-parsing berita dari halaman sumber. Sementara hanya rangkuman dari rss saja yang tampil di halaman berita.
Anda ingin bergabung untuk sekedar berkontribusi? Mari..
Ini merupakan catatan pengembangan ketiga, sebagai catatan rilis alpha3 pembangunan portal berita Kalamangga.Com. Berikut data terkini dan perubahan yang dilakukan :
- Pengunduh data RSS, MagpieRSS 0.72 [tetap];
- Basis data mysql [tetap];
- Berita yang tampil adalah 50 berita terkini dari situs-situs berita yang masuk ke daftar [tetap]; dan
- Melihat rangkuman tiap berita dalam 1 (satu) halaman dengan URL yang teroptimasi untuk mesin pencari (SEO) [baru].
Sampai saat ini saya masih belum bisa membuat halaman pencarian.
Selamat menikmati.
Ini merupakan catatan pengembangan kedua, sebagai catatan rilis alpha2 pembangunan portal berita Kalamangga.Com. Berikut data terkini dan perubahan yang dilakukan :
- Pengunduh data RSS, MagpieRSS 0.72 [tetap];
- Cache atau penyimpanan sementara sudah tidak digunakan lagi [hapus];
- Bila rilis alpha tidak memerlukan basis data, pada rilis ini digunakan basis data mysql [baru]; dan
- Berita yang tampil adalah 50 berita terkini dari situs-situs berita yang masuk ke daftar [ubah].
Semoga dalam waktu dekat saya bisa membangun fitur pencarian.
Selamat menikmati.
Ini merupakan catatan pengembangan pertama dalam proyek ini. Catatan seluruhnya akan terkumpul di situs pengembangan.
Ini adalah rilis alpha, tahap percobaan awal, pembangunan portal berita Kalamangga.Com. Berikut teknologi yang dipakai dalam pengembangan awal ini :
- Pengunduh data RSS, MagpieRSS 0.72;
- Cache disimpan dalam penyimpanan sementara;
- Tidak memerlukan basis data apapun; dan
- Berita yang tampil adalah berita terkini dari situs berita.
Selamat menikmati.
Dengan segala pertimbangan, desain serambi proyek menggunakan tema halaman muka situs web saya. Silakan Anda lihat pada situs proyek dan situs pengembangan.
Sedangkan untuk situs catatan pengembangan sebenarnya hanyalah sebuah implementasi sederhana dari proyek yang merujuk kembali ke blog saya ini.
Untuk apa proyek ini dibangun? Tunggu penjelasan saya. *entah-kapan-bisa-menjelaskan*
Halaman ini merupakan catatan pengembangan proyek Kalamangga.Net.
Catatan ini merupakan agregasi dari catatan pengembang.