weiqsh的个人博客分享 http://blog.sciencenet.cn/u/weiqsh

留言板

facelist

您需要登录后才可以留言 登录 | 注册


[4]HuangDave   2017-4-18 14:08
谢谢老师
[3]HuangDave   2017-4-16 14:41
魏老师您好,我是北京交通大学的学生,最近在做drupal利用Feeds及其相关组件进行信息采集的实现,通过阅读您的论文:《Drupal数据采集在构建特色数字资源中的实践》给了我很大的帮助,但是在您的论文中提到的“通过Tamper进行数据转化”这部分我有些问题想请教您一下。我现在想采集的是这个标签中的URL:<a href="index.php?item/14">Hsu Fu Chi candies</a>,其中我的XPATH语法是这样的:concat('http://classifieds.chineseculture.biz/index.php?item/',substring(td[2]/a/@href,16)),导入完成之后再debug信息中我看到了采集到的URL是正确的:xpathparser:2 :

    http://classifieds.chineseculture.biz/index.php?item/14
但是,我在“content”中选择相应的采集到的内容,点击上面的Link,却发现解析出来的URL变成了这样:http://classifieds.chineseculture.biz/index.php?item%2F14。原来最后面的“/”变成了“%2F”,所以我就想利用Feeds Tamper进行替换,在“Find Replace”中尝试着去将“%2F”替换为“/”失败了,在“Find Replace REGE”中尝试着去替换,也失败了,然后我就尝试着去替换我的采集内容中的其他内容,发现也不起作用,清除缓存之后去尝试也不起作用,所以我想问一下老师是不是我的Feeds Tamper不起作用,也想请求老师在百忙之中抽空为我解答一下我的疑惑,给我提点一下这个困扰了我很久的问题。
我的回复(2017-4-18 09:22):你好,我们当时是在drupal工程师协助下进行的数据抓取,目前已经不能更新了,建议你加入durpal群问下里面的高手。群号:18291588 从研究角度可以用durpal做一些研究探索,正式的应用还是有些麻烦。这是我个人感觉。
[2]魏青山   2013-10-14 17:33
已提交问卷。
[1]李蕾   2013-10-13 16:14
老师您好,我是南京理工大学经济管理学院管理科学与工程专业的一名博士生,最近想做一份用户打标签行为的调研(就是您在发表博文时会让您给博文添加标签),但是我缺少研究数据,恳请您在百忙中抽空帮我填写一份问卷,问卷大约需要您5分钟的时间,非常感谢您!!
      问卷地址是:http://www.sojump.com/jq/2709468.aspx 将此链接复制进浏览器的地址栏,然后按回车键即可,非常感谢您!!!

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-4-6 21:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部