From downloaded WebPages, we extracted content information, such as title, key words, category, time and text, by means of IE.
英
美
利用信息抽取的方法,从下载的网页中抽取得到语料库建库所需的内容信息,如标题、关键词、类别、时间、正文等。
目录
查词历史
英 汉