在采集文章的时候,经常会遇到文章正文带有附件的情况,附件下载下来,其实他的名称是一串数字或者字符,但我们的系统中,都是以附件实际的名称列为附件的链接名称的,怎么样解决这种问题呢?
我们在采集文章的时候,可以不把附件当做附件进行采集,而是当做内嵌在文章中的文档去采集,此时,就不需要再对附件项进行设置了,直接在下载的文档和图片类型中,输入所有附件涉及到的格式即可。如下图所示:
上一条:怎么样快速采集网站中相似栏目的文章? 下一条:计数器组件中的计数器类型,总点击次数和总点击人数这两个类型有什么区别?
四川文理学院 © 2023-2024 蜀ICP备06020089号-1