知玩指南
白蓝主题五 · 清爽阅读
首页  > 域名解析

文档格式有什么区别?一文看懂常见文件类型的门道

平时办公、传资料,谁还没和各种文档打过交道?你有没有遇到过这种情况:朋友发来一个 .docx 文件,你用手机点开却提示不支持?或者自己保存的 PDF 在别人电脑上乱码?其实问题就出在文档格式上。别小看那几个字母后缀,它们决定了文件能不能打开、排版会不会跑偏。

.doc 和 .docx:老前辈和新标准

用过 Word 的人都见过 .doc 和 .docx。前者是 Word 2003 及更早版本的默认格式,后者从 Word 2007 开始成为主流。.docx 其实是压缩过的 XML 文件集合,体积更小,容错性更强。比如你写了一篇 10 页的报告,用 .docx 能省下近 30% 空间。现在大多数设备都支持 .docx,但一些老系统或嵌入式设备可能还只认 .doc。

PDF:跨平台的“印刷级”格式

PDF 最大的特点就是“到哪都长一个样”。你把 Word 导出成 PDF,发给客户,无论对方用 Mac、Windows 还是手机,看到的字体、图片位置都不会变。这是因为 PDF 把所有内容“拍平”了,像一张电子照片。很多合同、简历都要求提交 PDF 版,就是为了防止格式错乱。

生成 PDF 的方式也很多,比如在 Word 里选“另存为”->“PDF”,或者用浏览器打印功能选择“另存为 PDF”:

<!DOCTYPE html>
<html>
<head><title>导出PDF示例</title></head>
<body>
<button onclick="window.print()">保存为PDF</button>
</body>
</html>

纯文本:.txt 最简单也最通用

如果你只需要传递文字,不要任何加粗、换行、颜色,.txt 是最轻量的选择。它几乎能在任何设备上打开,连几十年前的老终端都能读。程序员写脚本、记日志常用这种格式。不过缺点也很明显——没法排版,所有内容都是“大杂烩”。

Markdown:程序员爱用的轻量标记

现在很多人写文档用 .md(Markdown)格式。它用简单的符号控制格式,比如用 # 表示标题,*斜体* 表示强调。写起来像记笔记,又能导出成 HTML 或 PDF。GitHub 上的说明文档基本都是 .md 写的。

# 这是一级标题

这是普通段落,*这是一段斜体文字*。

- 列表项一
- 列表项二

表格格式:.xls 和 .xlsx

Excel 文件也有类似 Word 的演变路径。.xls 是旧版格式,单表最多 65536 行;.xlsx 支持超过百万行,适合处理大数据。如果你导出的报表超过六万条记录,就必须用 .xlsx,否则数据会被截断。

不同格式各有适用场景。日常协作推荐用 .docx 和 .xlsx,正式提交用 PDF,快速记录用 .txt 或 .md。搞清楚它们的区别,下次传文件就不会再被“打回重做”了。