前陣子以 PHP 實作了發文至 Yahoo, Wretch, Yam, Xuite 等部落格的程式,說困難也不困難,但卻是挺繁雜的。最近我也開始思考同步發文的意義與其重要性,並且在這之前我也在各處申請屬於自己 Blog 的服務,自己卻遲遲沒有進行同步發文的動作。
原先我都是手動將文章轉成 wordpress.com 能吃的格式,登入餵進,在那邊保持一份備份。今天在整理 Pixnet 這邊的 Blog 時,意外發現在 Google 某關鍵 keyword 時,出現的不是 Pixnet 這邊的文章,反而是 wordpress.com 那裡的,當下有些好奇,仔細一看,原來 wordpress.com 是把文章標題弄成文章 link 中的路徑之一,這將使得在 Google 結果的排名躍居於我在 Pixnet 主站前面,甚至連主站都看不到,於是我似乎又有種感觸,到底這樣的情境是不是想要的?
主站看不到的原因,有一種可能,那就是 Google 在 index 時將重複內容的網頁給去掉了,這似乎不是我所期待的事,畢竟有個站為主,就希望搜尋結果是在主站嘛。這使得我想更細微地考慮同步發文的意義。前陣子看學長們的討論,論及 Blog 服務時,當下就一個觀點:使用者只需要一個 Blog 服務。沒理由去維護多個 Blog 服務 ,且主站就是會花比較多心力,並且希望獲得大家的光臨。那其他的 Blog 服務的意義呢?
除此之外,在老板領導的方向上,我非常認同追求民有民治民享的概念,因此追求將資料分散在各處,降低集中化的現象。真正的選擇,大概只能自行架站吧,但目前得知週遭架站的,十個有九個都還是吃別人的資源罷了,我覺得不是很好,大概是這種想法,大四時我就拋棄擺台機器的念頭。在 Web 2.0 的架構,不少條款都說使用者發佈到網站上得資料,最終所有權是網站公司的,不然網站公司從透過大夥分享的資料所賺取的營收,怎不以現金,公平回饋到使用者身上呢。而 Web 2.0 其實就是反向用這種方式掙錢。以無名的用戶來說,今年六月左右,約 400 萬的用戶中,也只有不到 5% 的使用者有購買 VIP 服務,剩下的營收方式?當然就是廣告,那廣告的來源?抽絲剝繭,又回到人的身上罷了。如果不斷地龜毛起來,剩下的就只剩一嘴毛啦,哈。總之,這類的平衡現象就是世界的亂度吧!
現在觀來,同步發文有其缺點以及維護的成本,成本就是必須主動地對各家封閉性的網站客制化。站在一般使用者的角度上,只用來無痛搬家吧!至於我挑選 Pixnet 當落角處,除了校友免費有 1GB 的空間外,最重要的則是 Pixnet 很用心且有技術地進步,以及提供便利的備份方式,格式是公開且廣泛使用的,不像某家只提供一個好看的樣子,但格式根本不通用,連自家系統也不吃。
請問有『發文程式』的參考資料嗎?
回覆刪除版主回覆:(06/21/2010 12:42:46 AM)
這東西算自行摸索, 倒沒有參考什麼資料, 目前老板還未說要open source, 所以我手邊這份無法分享, 之前我有稍微整理一下, 可以參考"[PHP] 客製化部落格同步發文實作筆記 - 模擬瀏覽器行為":http://changyy.pixnet.net/blog/post/23010141 , 但也沒有談到很多, 整體上, 就是使用 curl 去收集資料(cookie), 因而達成模擬的動作, 最後再用 curl 提供的 HTTP POST 的功能, 就可把文章發表到 blog 上頭, 簡單地說, 要先模擬登入, 再模擬發表文章.