欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  web前端

网页正文信息一般存储在哪里_html/css_WEB-ITnose

程序员文章站 2022-05-04 11:28:06
...
毕业设计的题目是基于统计的网页正文信息抽取,因次需要知道一般的网页都把正文信息放在什么组件里面啊


回复讨论(解决方案)

呵呵
这个不好说 反正在body里面
哈哈

呵呵
这个不好说 反正在body里面
哈哈
看到一篇论文说一般是放在table里的

table是表格,以前做网页一般都是用表格来做排版和放置正文,现在很多网站都是用DIV+CSS的形式来,那么文字就可能是放在DIV中,而并非表格

也可以放在数据库里面,更新,维护容易

感觉说得比较模糊...有两种可能:1,是显示的正文,这里当然是指

和之间的内容,2,网页正文,即组成该网页的所以内容,也即和之间的内容(前面那句代码估计也是吧?不清楚),这好象是网络爬虫搜索的内容,根据你的题目(基于统计的网页正文信息抽取)估计是通过提取web页面内容然后搜索指定内容进行统计...所以应该上第二种情况...呵呵

这要“具体网站具体分析”了吧,有的网站主要数据内容是在table中,有的却可能在div,甚至dl、ol、ul中。

放在html里呵呵,

放在






这不都扯淡的么

爱放哪儿就放哪儿

引用 1 楼 xming4321 的回复:
呵呵
这个不好说 反正在body里面
哈哈

看到一篇论文说一般是放在table里的
一般正文信息在段落

中,因为

才是符合标准的终端块状元素,
现在的网页都用div css进行排版,
所以放在

中的都是些存在纵横表格式关系的数据信息。

毕业设计的题目是基于统计的网页正文信息抽取,因次需要知道一般的网页都把正文信息放在什么组件里面啊
请问楼主的正文抽取程序搞定了吗 能不能发我一份参考一下 非常感谢!!

网页正文信息一般存储在哪里_html/css_WEB-ITnose

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频


网友评论

文明上网理性发言,请遵守 新闻评论服务协议

我要评论
  • 网页正文信息一般存储在哪里_html/css_WEB-ITnose
  • 专题推荐

    作者信息
    网页正文信息一般存储在哪里_html/css_WEB-ITnose

    认证0级讲师

    推荐视频教程
  • 网页正文信息一般存储在哪里_html/css_WEB-ITnosejavascript初级视频教程
  • 网页正文信息一般存储在哪里_html/css_WEB-ITnosejquery 基础视频教程
  • 视频教程分类