基于XML的Word文档格式智能识别
时间:2010-12-25 来源:T.337
目标
研究论文格式智能检查系统,开发在线论文管理网站,提供给指导老师、学生之间进行论文管理、指导、互动的一个平台,代替人工管理,更高效的完成任务。
功能模块
1)个人信息管理模块;
2)论文格式设置、检查管理模块;
3)在线答疑/留言模块;
4)学生论文选题模块;
5)老师提供论文选题模块;
6)毕业论文套表生成/编辑/查看/下载模块;
7)论文格式检查/自动更正模块:上传要检查的论文,系统读取提交的Word论文,并与系统中的标准格式进行匹配,提示不符合规范的文字和段落,并可自动更正。检查的格式的正文及各级标题的字体、大小、行距,表格的表头及表格,页面大小、页边距、页眉页脚、装订线位置。
8)毕业论文结束时,评审专家根据论文评审结果填写相应的评审意见表,答辩后填写答辩情况表并依据具体情况给予成绩评定。
系统结构
结合微软Office Word2003 以上版本对XML较好的支持特性,通过Word 文档和XML文档的相互转换,设计一个Word 文档录入和格式检测模型系统。
微软从Office Word 2003 开始已经针对XML 进行了完整设计,使其支持称为Word 标记语言(WordML)的原生XML词汇。开发者可以建立这种XML和可编程的代码来增强Word文档,并帮助用户建立和修改文档。通过重复使用模版内容、为如何格式化或完成文档实现业务规则、通过正式批准的过程路由(routing)文档等等过程。
三层:XML转换层、XML存储层、XML表现层
参考
Microsoft Office Word 2003 中的 XML http://www.microsoft.com/china/msdn/library/office/office/XMLOfficeWord2003.mspx?mfr=true
英文版 http://msdn.microsoft.com/zh-cn/magazine/cc164064(en-us).aspx#S1