搜索
您的当前位置:首页正文

Excel2007文档信息隐藏方法

来源:小奈知识网
70 2010.46(28) ComputerEngineering口 『fc口ffDn 计算机工程与应用 Excel 2007文档信息隐藏方法 刘玉玲 ,万 晶 ,辛国江 LIU Yu—ling ,WAN Jing ,XIN Guo-jiang。 1.湖南大学计算机与通信学院,长沙410082 2.湖南网络工程职业学院信息技术系,长沙4 10002 1.College of Computer and Communication,Hunan University,Changsha 410082,China 2.Department of Information and Technology,Hunan Network Engineering Vocational College,Changsha 4 1 0002,China E—mail:yulingliu@1 26.corn LIU Yu—ling.WAN Jing,XIN Guo-jiang.Steganography method of Excel 2007 document.Computer Engineering and Ap。 plicafions,2010,46(28):70-72. Abstract:Microsofl Ofice Excelf 2007 document introduces a new default file format.The file format,called Excel XML for— mat,offers new ideas for steganography in Excel documents.Combining the features of Excel 2007 documents and XML spec- ifications,an Excel 2007 document steganography method based on insigniicantf attibute isr proposed.Firstly,the hidden infor— mation iS encrypted and convened to the Unicode hexadecima1 code.Then.the XML components used for hiding information are selected.And then an insignificant attribute iS created.Finally.the convened string iS written as the value of the insignifi— cant attribute.Experiment results show that the method can achieve large information—carrying capacity and a be ̄er result with the imperceptibiliy.tThe method can be used for secret communications. Key words:eXtensible Markup Language(XML);Oficef Open XML;Excel XML;steganography;insigniifcant attribute 摘要:Excel 2007文档采用了一种新的默认文件格式,即Excel XML格式,这种新的格式为在Excel文档中隐藏信息提供了新 的思路。结合Excel 2007的自身特点和XML规范,提出了一种基于无用属性的Excel 2007文档信息隐藏方法。该方法首先将 待隐藏的信息加密后转换为十六进制的Unicode码,然后通过算法选择可用于隐藏信息的XML部件,并创建无用属性,最后将转 换后的字符串作为无用属性的属性值写入,从而达到信息隐藏的目的。实验表日月,该方法的容量较大,隐蔽性好,可用于隐秘通信。 关键词:可扩展标记语言;0fice Open XML;Excelf XML;信息隐藏;无用属性 DOI:10.3778 ̄.issn.1002—8331.2010.28.020 文章编号:1002.8331(2010)28—0070.03 文献标识码:A 中图分类号:TP309.2 目前,关于图像、音频、视频信息隐藏方面的研究很多,而 且取得了较多研究成果。与这些载体相比,文本中可用于隐 些方法主要是针对Ofice 97—f2003的文档所提出的。然而,微 软的Oficef System 2007自发布以来,由于其文件格式的优 藏数据的冗余空间非常有限,其中的文字编码不能容许噪声 的出现,所以在文本中嵌入信息而不被察觉难度较高,导致文 本信息隐藏技术的研究相对滞后。对文本信息隐藏的研究始 于贝尔实验室的Maxemchuk等人,他们于1994年首次提出在 数字文档中嵌入标记以保护电子出版物所有者利益的方法u 。 由于Ofice文档在电子商务、电子政务以及人们日常生 f活中使用最为频繁和广泛,利用Ofice文档来进行隐蔽通信 f势,已被越来越多的用户所接受,所以也有学者提出了一些专 门针对Oficef 2007文档的隐藏方法,具体见文献【5.71。 Excel文档作为一种功能强大的电子表格软件,它可以广 泛应用于金融、经济、财务、行政、统计和审计等许多领域。随 着Oficef System 2007的逐渐普及,Excel 2007将会被更多的 用户所接受。本文根据Excel 2007的自身特点以及基于 XML的信息隐藏方法提出一种基于无用属性的Excel 2007 文档信息隐藏方案。 是极为便利的事情,目前已有学者针对微软Ofice系列的复 f合文档提出了一些独有的方法∞ 。此外,根据Word特定的特 征,还有学者提出一种利用Word固有的修改追踪技术 (change tracking technique)在文档中嵌入信息的方法 ]。这 1 Excel 2007文件格式 Microsoft Oficef Excel 2007提供了一种新的默认文件 基金项目:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60736016,No.60973128,No.60973113);湖南 省高等学校科学研究项目(the Science Program of Institutes of Higher Education of Hunan Province under Grant No.09w023)。 作者简介:刘玉玲(1980-),女,博士,讲师,主要研究领域为网络安全;万晶(1988一),女,硕士生,主要研究领域为网络安全;辛国江(1979.),男,讲 师,主要研究领域为视频检索。 收稿日期:2009—11-26修回日期:2010—01—14 刘玉玲,万 晶,辛国江:Excel 2007文档信息隐藏方法 201046(28) .71 格式:Microsoft 0mce Open XML格式 (Excel XML格 式)。这种格式基于开放打包约定(Open Packaging Conven. tions),由一个压缩的ZIP包组成,称为包。这个包将文件分成 些文档部件,其中每个部件定义了文件的部分内容,当希望 更改文件当中的一些内容时,可以简单地查找希望更改的文 一guage)的语言,因此同样具有XML的特点并满足XML的规 范 ” 。首先,元素也是组成Excel XML的最基本的单位,元 素可以带有若干个属性以及属性值作为附加信息。其次,Ex cel XML也具有良好的可扩展性。通过实验发现,在Excel 2007文档的XML部件中,可以在元素中添加一些无用属性而 档部件,无需影响其他基于XML的文档部件。新的文件格式 更加稳定和强大,并且可以更为简单地处理自定义XML,而 且它比二进制文件格式要更小 。 图1是一个典型Excel 2007文档(test.xlsx)的层次化文件 结构,可以看到,test.xlsx工作簿(workbook)中包含了三个工 不会影响文档的正常显示,也不会发生任何错误,如图2中元 素fileVersion的属性aaaa,元素workbookPr的属性bbbb,元素 sheet中的属性CCCC、属性dddd和属性eeee都是添加的无用属 性。这些无用属性同样必须符合XML的命名规范,如:名字 中只能包含字母、数字以及其他字母;名字不能以数字或“” (下划线)开头;名字不能以字母xml(或XML或Xml…)开头; 名字中不能包含空格。无用属性可加载的位置是:除『Con. 作表(worksheets)。『Content Types].xml描述出现在文件中的 每个内容类型;App.xml文件包含了应用程序特定的属性; Core.xml文件包含了所有基于开放打包约定文档格式的通用 文件属性;_rel后缀的文件描述了文档结构中的起始关系,被 称为关系部件。 tent Types].xml ̄b,Excel 2007文档的其他任何xml部件中不 是第一行或者紧邻元素中的“<”的位置。在这些位置添加无 用屙陛后,不会给Excel 2007文档的显示带来任何改变。 2.2信息隐藏方案 根据上一节无用属性的特点,可以利用这个冗余特性,通 过将待隐藏信息写入无用属性的属性值中,从而实现在Ex. cel 2007文档中隐藏信息的目的。如图2中的“aaaa”是元素 ifleVersion无用属性名,它的属性值“123”可以是需要隐藏的 信息。 为了保证安全性,不是将待隐藏信息直接写入无用属性 的属性值中,而是首先利用加密算法将待隐藏的信息进行加 密,本文选用IDEA加密算法。然后将每个密文字符转换为十 六进制的Unicode码写入。 由于无用属性的属性值没有长度限制,这种隐藏方法可 以较好地保证信息隐藏的容量。但是为了保证隐蔽性,并不 是将所有可加载无用属性的XML部件都用于隐藏信息,需要 设计算法选择信息嵌入位置。嵌入信息后为了保证提取信息 时能够顺利地提取,无用属性名必须保证不与Excel XML本 身的属性名冲突,否则提取信息时将发生错误。 图 3算法描述 3.1信息嵌入位置选择算法 解压Excel 2007文档后得到的所有XML部件中,除了 [Contem_Types].xml文档不能进行变动外,其他部件都可以用 于隐藏信息。但是考虑到隐蔽性和安全性,只选取其中的某 2基于“无用属性”的信息隐藏方案 2.1无用属性 Lan. Excel XML是一种基于XML(eXtensible Markup 些部件进行隐藏,具体算法流程如下: 72 2010.46(28) ComputerEngineering口 ,fc口ffo 计算机工程与应用 (1)遍历解压文件得到XML部件数,并按照文件名字母 大小对这些XML部件进行排序及编号; (2)以当前时间作为种子产生随机数,得到n个随机数, 并对上一步得到的文件个数取模; (3)根据3个取模结果分别选取 个XML文档用于嵌入 添加的无用属性,因此具有良好的隐蔽性。 (3)信息隐藏容量:XML规范中对属性值的长度没有限 制,因此添加的无用属性的属性值长度可以任意设置,这在理 论上可以保证这种隐藏方法的容量没有限制。但是通过统计 分析发现,Excel XML中属性值的平均长度一般在5位,除了 隐秘信息。 3.2信息嵌入算法 输入:Excel 2007文档 ,待隐藏信息 ,密钥 。 输出:载密文档 。 具体流程如下: (1)加密:M E(M, ); (2)将密文转换为16进制的串: =ToHexString(M9; (3)利用3.1节算法获取待隐藏的XML部件; (4)对于每个需要嵌入信息XML文档部件,遍历其中的 文档节点; (5)对于每个节点{ (5.1)获取该元素的属性列表; (5_2)获取属性列表中的第一个属性节点; (5.3)创建一个满足规范的属性名作为无用属性节点,并 按序获取4位十六进制的串(即1个字符对应的Unicode码)加 入属性值中; (5.4)将无用属性添加到元素中; (5.5)将插入的属性移至最后面使之成为节点的最后一 个属性;} (6)保存新文档 ,信息嵌入完毕。 3.3信息提取算法 输入:载密Excel 2007文档 ,密钥K: 输出:隐藏信息^ 具体流程如下: (1)利用3.1节算法获取隐藏了信息的XML部件; (2)对于每个需要嵌入信息XML文档部件,遍历其中的 文档节点; (3)读取每个XML文档节点,首先获取其中每个元素的 属性列表;然后获取属性列表中的最后一个属性节点;最后读 取该属性的属性值; (4)M =HexToString(S1; (5)解密M=D(M ,K),得到隐藏信息 4算法实现及性能分析 本文的实验环境是WinXPSP2,Visual cH6.0以及MS. XML。MSXML是一个XML文档解析器,实际上是一个 C0M对象库,里面封装了所有进行XML解析所需要的所有 必要的对象。文中的实验文件是从Google网站上搜索并下载 的一些Excel 2007文档。下面分别从安全性、隐蔽性和信息 隐藏容量方面进行分析。 (1)安全性:隐藏的信息首先经过破解难度高的IDEA加 密处理,然后转换为一一对应的Unicode码,这样可以保证隐 藏的信息具有较高的安全性。 (2)隐蔽性:通过实验证明,在XML部件中添加无用属性 后,不会引起Excel 2007文档显示的改变,也不会影响文档的 正常使用。由于只是随机地选用了部分XML文档进行嵌入, Excel 2007文档的文件大小在信息嵌入前后改变不大,而且 采用手动方式对文档解压后查看原始XML部件也较难发现 文档声明外,因此,只考虑在添加的无用属性中写入4位十六 进制的串作为属性值。 5结语 提出了一种在Excel 2007文档的解压包中对XML部件 添加无用属性的信息隐藏方案,并对该方案的安全性、隐蔽性 及信息隐藏容量进行了实验分析。实际上,通过实验发现,这 种隐藏方案同时也可适应于Word 2007文档,但是不能适应 于PowerPoint 2007文档。 除了这种隐藏方法外,可用于XML文档中的其他信息隐 藏方法,如:添加不可见字符、属性顺序的排列等也可以在 Excel 2007文档中使用。不过这些方法与本文所提出的方法 都面临的一个问题是鲁棒性和抗攻击性不强。因此,随着 Ofifce 2007系统的逐渐普及,下一步的工作将主要研究如何 进一步提高信息隐藏的鲁棒性和抗攻击性以及开发基于 Word 2007、PowerPoint 2007的信息隐藏算法。 参考文献: [1]Maxemchuk N F.Electronic document distribution[J].AT&T Tech— nical Jouma1.1994:73.80 [2]Cantrell G,Dampier D D.Experiments in hiding data inside the ifle structure of common ofifce documents:A steganography ap- plication[C]//The 2004 International Symposium on Information and Communication Technologies,LasVegas,2004,6:146—151. [3]Castiglione A,Santis A D,Soriente C.Taking advantages of a disadvantage:Digital forensics and steganography using docu— ment metadata[J].The Journal of Systems and Software,2007 (80):750.764. [4]Liu T Y,Tsai W H.A new steganographic method for data hid— ing in Microsoft word documents by a change tracking tech・ nique[J].IEEE Transactions on Information Forensics and Securi— ty,2007,2(1):24-30. [5]徐敏,王衍波,李涛.Word2007文档信息隐藏的新方法[J】.计算机 研究与发展,2009,46(增刊):112.116. [6]Bora P,Jungheum P,Sangjin L.Data concealment and detection in Microsoft Ofifce 2007 files[J].Digital Investigation,2009,5(3/ 4):104—114. [7]Simson L,Garfinkel,James M.The new XML oMce document ifles:Implications for forensics[J].IEEE Security&Privacy. 2009,7(2):38-44. [8]8 Microsoft.Ofifce(2007)Open XML文件格式简介【EB/OL]. http://www.microsoft.com/china/msdn/library/office/ofifce/Ofif— ceOpenXMLFormats.mspx?mfr=true. [9]如何操作Ofifce Open XML格式文档[EB/OL].http://www.micro. soft.com/china/msdn/library/ofifce/ofifce/howManipulateOfifcex— m1.mspx?mfr=true. [1O]XML规范[EB/OL].http:Ilwww.w3.org /l99非Ec.xml一19980210. pdf. [11]XML元素和属性名称及ID值的编码和解码[EB/OL].http://ms— dn.microsoft.com/zh.cn/library/xfaz0c52.aspx. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top