新聞中心
Python RSS文件作為當(dāng)今開發(fā)界非常流行的語言之一,目前有許許多多的門戶網(wǎng)站和 Web 日志都使用了他們,這個(gè)也是可以與 RSS 一起工作的 Python 工具中的少數(shù)幾個(gè)。

成都創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比斗門網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式斗門網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋斗門地區(qū)。費(fèi)用合理售后完善,十多年實(shí)體公司更值得信賴。
但它卻提供了一個(gè)非常自由的解析器,它能很好的處理 RSS 世界中所有令人混亂的差異。以下摘自 rssparser.py 頁面。如您所見,大多數(shù) RSS 供給都很糟糕。無效的字符、未轉(zhuǎn)義的 & 符號(hào)(Blogger 供給)、無效的實(shí)體(Radio 供給)和未轉(zhuǎn)義以及無效的 HTML(通常為注冊中心所提供的)。
或者只是 Python RSS文件元素和 RSS 1.0 元素的一個(gè)籠統(tǒng)的混合(可移動(dòng)類型供給(Movable Type feeds))。還有許多太前沿的供給,就象 Aaron 的 feed。他將一個(gè)摘錄放入描述元素中而將完整的文本放入 content:encoded 元素中(象 CDATA)。這是一個(gè)有效的 RSS 1.0,但沒有人回真正使用它(除了 Aaron),幾乎沒有新聞聚集器支持它。
并且許多解析器還排斥它。其他解析器被 RSS 0.94 中的新元素(guid)所困惑(請(qǐng)參閱 Dave Winer 供給作為一個(gè)示例)。還有 Jon Udell 的供給,其中還有他才從創(chuàng)作中挑選出來的 fullitem 元素。XML 和 Web 服務(wù)會(huì)增加互操作性幾乎已成定局,所以這樣考慮其實(shí)很可笑。無論如何,設(shè)計(jì) rssparser.py 目的就是要處理所有這些荒唐的情況。
安裝 rssparser.py 也十分簡單。請(qǐng)您下載 Python 文件(參閱參考資料),將“rssparser.py.txt”重命名為 “rssparser.py”。并將它復(fù)制到您的 PYTHONPATH 中。我同樣建議您取得可選的 timeoutsocket 模塊,它可以改進(jìn) Python 中的套接字操作的超時(shí)行為,這樣有助于取得 RSS feeds 而不必為了防止錯(cuò)誤就停止應(yīng)用程序線程。
- import rssparser #Parse the data, returns a tuple: (data for channels, data for items)
- channel, items = rssparser.parse("http://www.python.org/channews.rdf") for item in items:
- #Each item is a dictionary mapping properties to values print "RSS Item:", item.get('link', "(none)")
- print "Title:", item.get('title', "(none)") print "Description:", item.get('description', "(none)")
如您所見,這段代碼非常簡單。RSS.py 和 rssparser.py 不能互相取代在很大程度上是因?yàn)榍罢哂懈嗟墓δ懿考?,并且維護(hù)著 RSS 供給中更多的語法信息。后者更簡單,并且是一個(gè)容錯(cuò)能力更強(qiáng)的解析器(RSS.py 解析器只能接受格式良好的 XML)。
一個(gè)和其他大多數(shù)語言(如C)的區(qū)別就是,一個(gè)模塊的界限,完全是由每行的首字符在這一行的位置來決定的(而C語言是用一對(duì)花括號(hào){}來明確的定出模塊的邊界的,與字符的位置毫無關(guān)系)。
這一點(diǎn)曾經(jīng)引起過爭議。因?yàn)樽詮腃這類的語言誕生后,語言的語法含義與字符的排列方式分離開來,曾經(jīng)被認(rèn)為是一種程序語言的進(jìn)步。不過不可否認(rèn)的是,通過強(qiáng)制程序員們縮進(jìn)(包括if,for和函數(shù)定義等所有需要使用模塊的地方),Python RSS文件確實(shí)使得程序更加清晰和美觀。
另外Python在其他部分的設(shè)計(jì)上也堅(jiān)持了清晰劃一的風(fēng)格,這使得Python RSS文件稱為一門易讀性、易維護(hù)性好,并且被大量用戶所歡迎的、用途廣泛的語言。Python直接編寫的程序段有時(shí)運(yùn)行效率甚至高于用C編寫的程序。
網(wǎng)站欄目:淺析PythonRSS文件功能介紹
網(wǎng)站地址:http://www.fisionsoft.com.cn/article/dhpojhe.html


咨詢
建站咨詢
