问题

GEO对于PDF文档以及下载资源是否友好?

回答

PDF 并非不好,问题出在“不能选择、不能搜索、版本无法查看”。如果 PDF 是扫描件或者图片形式的话,系统抽取就会比较困难,引用价值也会降低很多。更好的方法就是提供可复制的文本格式为 PDF,在网页上同步给出相同的 HTML 摘要和重要条款,PDF 用作下载及存档使用。

有关政策、合同和规格书等重要信息,建议在页面上列出主要点以及修改记录,在PDF文件中要包含版本号及发布时间。多语言版本的文档名、元数据需要清楚明了,防止用户误下载到错误版本。下载资源时可以搭配FAQ:说明适用场景、限制条件以及与在线帮助的区别。

GEO 实用建议为“网页为主、PDF 为辅”,即网页主要承担可引用和可更新的任务,而 PDF 则用来完成正式发布及打印。既满足了企业的流程要求又降低了模型使用旧版 PDF 的可能性。如果需要在 PDF 中包含重要的条款的话,则可以给 PDF 加上首页摘要以及变更点,使得读者能够时间看到重要的内容,并且可以让系统也及时获取到这些信息。对于必须签字的合同类PDF仍然建议网页提供条款解读和适用范围,在对话中只给出片面结论会增加误解的风险。如果 PDF 会被经常更新的话,好在文件名或者封面标上版本号,在网站上建立一个“版本对照”,以减少使用旧版的情况发生。需要打印交付的时候,在页面上写明“打印版可能会滞后,请参考在线版”。