立即注册 登录
彼岸网 返回首页

天香公主的个人空间 http://www.bian-wang.com/discuz/?10005 [收藏] [复制] [分享] [RSS] txgz999@yahoo.com

日志

Discuz插件开发: 博客搬家

热度 2已有 1050 次阅读2015-12-24 01:11 PM |个人分类:Discuz| 博客

在前面的博文里,我讨论了如何从其它Discuz网站导入单篇博文(链接)。但有时候博主需要的不是导入一篇博文,而是导入博客里的所有博文。这经常发生在博主要在一个新网站上建博客。比如不久前中科院办的科学网(也有人称之为科邪网)封了一个名叫嵇少丞的加拿大华人教授,他就自办了一个华科网(希望不要变成科妄网),在那里他们就帮助科学网的博主们把博客办到新网站来(链接)。在本文中,我介绍下我写的一个提供这个功能的新插件:日志搬家。它可以将其它网站里的整个博客搬到自己网站来,也可以搬单篇博文。







插件安装和用法:
和通常插件安装过程一样,将本文文后所附的压缩文件解压到网站的source/plugin后会在其中产生本插件的文件夹txgz_blog_importer。然后进入管理中心的应用->插件页里的"未安装的插件"部分里会看到本插件"TXGZ日志搬家 0.8"。点击"安装"后就可以在"未启用的插件",这时点击"启用",就能在网站上用这个插件了。 plugin.php?id=txgz_blog_importer:blog 是个提供这个功能的单独网页。可以将链接加在网站的合适的位置。比如将这个链接放在工具页上,或者放在导航栏里作为一个子项(在界面->导航设置里设置) 。

一些技术讨论:
1) 网页解析工具:之前用PHP解析网页内容时,我一直用PHP带来DOMDocument 和 DOMXPath 类,但发现它解析网页某些网页时给出错误信息(如 链接 文中的日志数和 链接 文末的转载须知)。所以这次改用了S.C. Chen 等写的PHP Simple HTML DOM Parser (链接)迄今为止用下来只发现一个问题:没找到我彼岸网日志列表页首页(链接)里的翻页链接条(第二页后都没问题),所以不得不加上DOMDocument的代码作为后备。

2) 汉字编码转换:原来博客所在的网站和新网站不一定用同样的汉字编码,所以有可能需要转换博文的编码(如将 GBK 转为 UTF-8)。Discuz 提供了函数 diconv 来实现这个转换。

插件下载:http://www.bian-wang.com/discuz/data/userupload/10005/txgz_blog_importer.zip

发表评论 评论 (29 个评论)

回复 天香公主 2017-7-5 05:09 PM
东风: 通常情况下,搬家之后, 会在动态里出现所有的最新搬过来的博文, 而把最近的博文淹没掉; 但是这次之后; 一点也不~~~~内心的喜悦是无法言表的~~同时坚定这样一 ...
惭愧。较早的版本没有搬原来日志的发表时间,搬过来的日志都有新的发表时间,所以就都显示在动态里了。
回复 东风 2017-7-5 03:25 PM
天香公主: 东风好!我查了下不是https的问题,而是你想转的那个网站做了个小改动。我刚更新了文末的下载文件,现在应该可以用了 ...
通常情况下,搬家之后, 会在动态里出现所有的最新搬过来的博文, 而把最近的博文淹没掉; 但是这次之后; 一点也不~~~~内心的喜悦是无法言表的~~同时坚定这样一个事实:跟着天香干,是多么幸福的一件事!!!!!
回复 东风 2017-7-5 02:45 PM
天香公主: 东风好!我查了下不是https的问题,而是你想转的那个网站做了个小改动。我刚更新了文末的下载文件,现在应该可以用了 ...
测试完美,fantastic~~~
回复 东风 2017-7-5 06:49 AM
天香公主: 东风好!我查了下不是https的问题,而是你想转的那个网站做了个小改动。我刚更新了文末的下载文件,现在应该可以用了 ...
    太好了,明天就试验下。不说感激的话了,都在心里!
回复 天香公主 2017-7-4 08:21 PM
东风: 天香, 亲爱的,又来求救了~~

我们那领导要我转博客,一直实验都好好的, 今天一转, 都失败, 是因为我们转https吗?愁死了 ...
东风好!我查了下不是https的问题,而是你想转的那个网站做了个小改动。我刚更新了文末的下载文件,现在应该可以用了
回复 东风 2017-7-4 06:00 PM
忆江南: 现在行了。一个空格,天晓得,辛苦了。
天香, 亲爱的,又来求救了~~

我们那领导要我转博客,一直实验都好好的, 今天一转, 都失败, 是因为我们转https吗?愁死了
回复 忆江南 2016-4-6 10:43 PM
天香公主:    嗯,多了个不应有的空格,天晓得。我改过了 http://www.bian-wang.com/upload/txgz_blog_importer_160406.zip,请更新一下。
现在行了。一个空格,天晓得,辛苦了。
回复 天香公主 2016-4-6 07:02 AM
忆江南: 我的问题就是这个,在“由管理员为用户导入日志:”一项,我分别试了是和否,但都不能从现在的普通账户导入。用户这一项我一直设的“是”。 ...
   嗯,多了个不应有的空格,天晓得。我改过了 http://www.bian-wang.com/upload/txgz_blog_importer_160406.zip,请更新一下。
回复 忆江南 2016-4-5 09:02 PM
天香公主: 在管理中心->应用页,找到博客搬家这个应用,在它下方有个设置链接,点击后就能修改设置 (你现在观察到的是缺省设置的情形) ...
我的问题就是这个,在“由管理员为用户导入日志:”一项,我分别试了是和否,但都不能从现在的普通账户导入。用户这一项我一直设的“是”。
回复 天香公主 2016-4-5 09:00 PM
忆江南: 有个问题,原来是能用的,后来你更新了,加了两个选项:“由管理员为用户导入日志:”和“由用户自己导入日志:”。应该怎么设置?我刚才试,从管理员账户照样能导 ...
在管理中心->应用页,找到博客搬家这个应用,在它下方有个设置链接,点击后就能修改设置 (你现在观察到的是缺省设置的情形)
回复 忆江南 2016-4-5 08:52 PM
有个问题,原来是能用的,后来你更新了,加了两个选项:“由管理员为用户导入日志:”和“由用户自己导入日志:”。应该怎么设置?我刚才试,从管理员账户照样能导入,但从会员账户就不能。
回复 东风 2016-3-10 06:59 PM
天香公主: 谢谢,我看到你们已经在用了,欢迎反馈出现的问题。我近来测试中发现了几个小问题:
1)从原网站拿到的日志内容已经是html encode过了,这样存到自己网站里会再 ...
上次因为博客推荐文章到首页出现图片问题, 我以为是插件的事情, 结果测试不是的。
回复 天香公主 2016-3-7 12:31 PM
东风: 报告:测试完毕, 完全可行! ,新年快乐~

添加到帮助中心:http://www.beimeilife.com/misc.php?mod=faq&action=faq&id=31 ...
谢谢,我看到你们已经在用了,欢迎反馈出现的问题。我近来测试中发现了几个小问题:
1)从原网站拿到的日志内容已经是html encode过了,这样存到自己网站里会再次encode所以拿来后应先decode。这个问题不会影响日志里的汉字,但可能影响其中的某些符号
2)搬来时内容中的line break给忽略掉了。这个问题一般不会影响日志显示(除非日志里作者加了原代码),但看page source时会发现日志内容都连在一起
我上传了个新版本解决了这些问题:
http://www.bian-wang.com/upload/txgz_blog_importer_160311.zip
同时做了些其它改进:
1)保留原文发表时间
2)保留原文所在的系统分类,如果新站也有原文用的该分类
3)保留原封面图
4)支持从不同语言版本网站搬家(gbk, big5)
5)去掉了贝壳村日志结尾处的前后文链接
回复 东风 2016-1-3 05:22 PM
忆江南: 不客气,其实这里的技术问题一直是天香一力担纲的。做兄弟网站很好啊,具体怎么实现?我在彼岸主页的《四海一家》专栏里加了北美生活网的链接,可好? ...
谢谢,谢谢江南兄, 我在主页友情连接加上兄弟网站说明和连接了,顺道广播了下 http://www.beimeilife.com/thread-4154-1-1.html
回复 忆江南 2016-1-3 10:49 AM
东风: 江南兄,不知能否把北美生活网作为彼岸网的兄弟网站啊?因为从一开始就有很多技术难题是从您这里和天香兄学习来的,相信将来一定还会有很多,感觉有彼岸做老大哥 ...
不客气,其实这里的技术问题一直是天香一力担纲的。做兄弟网站很好啊,具体怎么实现?我在彼岸主页的《四海一家》专栏里加了北美生活网的链接,可好?
回复 东风 2016-1-3 05:42 AM
忆江南: 不好意思,这两天有点忙,刚刚上传。试过能用!新年快乐!
江南兄,不知能否把北美生活网作为彼岸网的兄弟网站啊?因为从一开始就有很多技术难题是从您这里和天香兄学习来的,相信将来一定还会有很多,感觉有彼岸做老大哥给撑腰,会倍有信心啊!
回复 东风 2016-1-3 05:09 AM
太厉害了!若没有版权问题,可以立马丰富网站资源了
回复 天香公主 2016-1-2 11:44 AM
东风: 报告:测试完毕, 完全可行! ,新年快乐~

添加到帮助中心:http://www.beimeilife.com/misc.php?mod=faq&action=faq&id=31 ...
    我感觉还是满powerful的,但细致处也许还可推敲,如
1)如何防止滥用?可以在安装时加个选项,让站长决定该插件是供普通用户用,还是仅管理员专用(让管理员帮普通用户导入)
2)版权问题:原博文里可能用了其它网站的图片,是一并导入还是只导入原博文网站里的图片呢?现在是都导入了
3)怎么避免导入后占满首页影响他人?也许发表时间可以用原博文的发表时间,或者将这些导入博文都归在一个不上首页的栏目里(如旧文搬家)
回复 东风 2016-1-2 05:13 AM
天香公主: 好,我也试过了。

新年快乐!
报告:测试完毕, 完全可行! ,新年快乐~

添加到帮助中心:http://www.beimeilife.com/misc.php?mod=faq&action=faq&id=31
回复 天香公主 2016-1-1 03:43 PM
忆江南: 不好意思,这两天有点忙,刚刚上传。试过能用!新年快乐!
好,我也试过了。

新年快乐!
12下一页

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 立即注册

小黑屋|Archiver|彼岸网  

Powered by Discuz! X3.1 © 2001-2014 Comsenz Inc.
GMT-4, 2017-9-25 07:22 AM , Processed in 0.061305 second(s), 19 queries.

返回顶部