ActiveRSS, newsGatherer, newsCrawler…

Şimdi efendim takip eden arkadaşlar bilirler, www.ahmetbutun.net adresinde verilen haberleri genellikle turk.internet.com web sitesinden, kaynak göstererek yayınlıyordum sitemde. Ama bu yoğunluk içinde ancak hafta sonları www.ahmetbutun.net ‘e yeni haberler felan girebiliyordum. Son dönemlerde ise hiç ilgilenemez olmuştum!

Baktım olacak gibi değil, oturdum yukarıdaki programı yazdım C# ile. Peki ne yapar ne eder bu program? Daha önce belirlenen RSS bilgilerinden web sitem için otomatik olarak haberleri benim için alıyor ve web sitemde yayınlıyor. Artı beni de haberdar ediyor, bak bugün şunu şunu ekledim siteye diye! Tam olarak bir RSS okuyucudan bir adım ötede bir yazılım. RSS okuyuculardan farklı olarak, RSS linkini takip ederek ilgili içeriğe ait web sayfasını parse ederek, habere ait içeriği de alıyor!

Yani misal, turk.internet.com ‘un Yazılım kategorisindeki RSS bilgileri http://turk.internet.com/rss/cat-19.rss adresinde yayınlanıyor. Girip baktığınızda göreceksiniz zaten, RSS öğelerine ait başlık ve kısa bir özet var sayfada. Dolayısıyla buradaki kısa özeti kullanıp sitede yayınlamak mümkün değil. Bu yazılım ile RSS öğelerine ait linki takip ediyoruz efendim, ilgili sayfaya bir HTTP isteği gönderip gelen cevabı parse -parse işleminde daha önce derinweb.com arama motorunu geliştirirken kullandığım HTML parser’ı kullandım- edip, haberle ilgili içeriği alıyoruz. Tabi bunların hepsi otomatik olarak gerçekleştiriliyor. Sonuç olarak web siteme haber bulma, girme gibi bir derdim kalmadı artık.

Büyük kolaylık valla 🙂 Umarım yayın hakları ile ilgili bir problem yaşamam!

,

No comments yet.

Bir cevap yazın

Font Resize