Разница между doc и docx. Как конвертировать из DOC в DOCX

Разница между doc и docx. Как конвертировать из DOC в DOCX

22.08.2019

Многие при скачивании или сохранении тестовых документов, созданных с использованием приложения Microsoft Office , сталкиваются с такими понятиями, как формат doc и docx. На первый взгляд различие в одном дополнительном символе, но если установленный сервис может поддерживать только определенный тип файлов, зачастую возникает масса неудобств.

Чаще всего на сегодняшний день встречаются файлы с расширением docx, но и ранее популярные.doc не менее актуальны. Правда, постепенно они используются все реже и реже. Да и офис более современных моделей способен открывать оба типа файлов, что нельзя сказать о более устаревших вариантах программного продукта.

Определение двух типов файлов

Прежде, чем начинать вести разговор об отличиях таких форматов, как.doc и.docx, следует разобраться с обозначением каждого из них.

Под doc понимают определенный тип электронных документов, которые формируется при работе с Microsoft Word . Сначала это было просто расширение для группы файлов, но в последствие так стали обозначать серию индивидуальных форматов компании Microsoft,

Docx — это сокращение, которое обозначает Office Open XML . Такое расширение текстовых документов используется для создания электронных документов с применением пакета программного продукта от Microsoft.

Основные различия между двумя типами файлов

В первую очередь разница файлов с этими форматами проявляется в возможности их использования в различных версиях пакетов от Microsoft. Программные продукты, выпущенные ранее 2003 года (в том числе и продукт указанного года) не смогут открыть и позволить работать с форматом docx. Использование файлов с таким разрешением возможно только в версиях офиса с 2007 года. При этом распознавать файлы с расширением doc может пакет любого года выпуска.

Но стоит помнить, что начиная с Microsoft Word 2007, появляется намного больше возможностей при создании текстовых документов. Поэтому при открытии старого формата.doc в более современном редакторе появится надпись «Режим ограниченной функциональности», который не позволит использовать все возможности редактора, ведь все равно сохранить их в doc не получится. Для того, чтобы с документом работать полноценно, следует сохранить его в усовершенствованном формате docx.

Для решения вопроса с открытием файла docx создан специальный конвертор, при использовании которого происходит распаковка требуемого файла с дальнейшей возможностью корректировки при необходимости. Ведь, по сути, файлы docx – ‘это специальные zip-архивы, в которых располагаются непосредственный документ в форме XML, а также все графики, рисунки, таблицы и схемы. Здесь же находятся файлы, которые определяют структуру и параметры содержания документа. Версия 2003 года и более ранние не могут справиться с самим процессом распаковки.

Именно такое сжатие и считается одним из главных различий между двумя типами офисных документов. Правда, благодаря ему размер файла становится значительно меньше. Особенно заметна разница в файлах, которые содержат большое число картинок или графиков. Для хранения docx намного удобнее, ведь занимает мало места на жестком диске.

Также стоит уделить внимание совместимости файлов с другими текстовыми процессорами. Формат docx в них поддерживается частично, а вот doc открывается совсем плохо. Существует один программный продукт – , который способен с легкостью открыть файл с расширением docx.

Также формат docx не получится использовать со шрифтами, начертание которых проводится справа налево. И этот тип Файлов поддерживает только собственные форматы Microsoft, не обращая внимание на установленные стандарты.

Основные отличия форматов doc и docx

Из полученной информации можно выделить следующее:

  1. Текстовый документ в формате docx открывается исключительно продуктами от компании Microsoft начиная с 2007 года, в то время, как doc – различными версиями Word.
  2. В файле docx используется zip- контейнер, что содержит документ в форме XМL.
  3. Doc вообще не предполагает наличие функции сжатия.
  4. Сторонние программы не совместимы (или очень плохо) с расширением doc.

Зная отличительные особенности таких файлов, теперь легко сориентироваться в целесообразности использования каждого из них.

Doc – это стандартное расширение файлов, созданных текстовым редактором Microsoft Word, начиная с версии 97 и до версии 2003, либо приложением WordPad . Подобные форматы на данный момент фактически устарели.

Версии редактора Word с 2007 года работают с документами, имеющими расширение docx . Соответственно, стандартной программой для открытия файла в старом формате будет версия Word до 2003 года включительно или WordPad, а в новом – Word 2007 или более современный.

Чем отличаются форматы документов

Файлы типа doc – это бинарные (двоичные) файлы, которые могут иметь разное строение , в зависимости от конкретной версии создавшей их программы. Документы, созданные WordPad, отличаются от вордовских в сторону примитивности.

Файл типа docx строится на основе формата Office Open XML . Он отличается от своих предшественников расширенными возможностями восстановления при повреждении. По своей сути это zip-архив текста XML и вспомогательных документов, размещенных в папках. Если открыть primer.docx архиватором 7-zip, то можно увидеть примерно следующее:

Чем открывают расширения doc и docx

А какими еще приложениями можно открывать документы с расширениями doc и docx? Список достаточно большой, но есть некоторые нюансы при их использовании. Корпорация Microsoft традиционно закрывает свои разработки от свободного использования, поэтому сторонние разработчики часто имеют проблемы с совместимостью.


А вот primer.docx с аналогичным содержимым понес некоторые потери – текстовая надпись внизу исчезла . В целом Writer из OpenOffice.org для работы с вордовскими текстами следует применять очень осторожно.



Текстовая надпись потерялась. При попытке редактирования сервис предупреждает , что результат будет сохранен как docx.

В старину, когда компьютеры были слабее современных мобильных телефонов, а люди пользовались операционной системой MS DOS, к именам текстовых файлов нередко добавляли расширение doc, подразумевая сокращённое слово «document». Однако в 90-х годах двадцатого века стараниями фирмы Microsoft по всей планете распространился новый вид цифровых документов - файлов с таким же расширением. В общем, речь пойдёт о результатах тех стараний. Ну и, конечно, немножко о форматах...

Как DOC попал в каждый офис

Можно ли заставить мир пользоваться только одним единственным комплектом офисных приложений? Да, и очень просто: достаточно создать закрытый бинарный формат файлов для документооборота, ни с чем не совместимый, кроме текстового процессора Word . Тогда, хочешь или нет, а купишь эту программу (в пакете Microsoft Office), никуда не денешься, ведь без неё ни одной фирме не прожить.

Так формат DOC попал в каждую (без преувеличения) контору, в каждую бухгалтерию, школу, университет, техникум и курсы обучения вышиванию крестиком. И как ни старались разработчики освободить народонаселение от жёсткой привязки к Microsoft Office, что-то получаться начало только с появлением LibreOffice, да и то пока лишь для документов с несложной компоновкой.

Суть в том, что формат DOC - бинарный и закрытый. Поди разбери, каким именно образом документ кодируется в последовательности нулей и единиц и как потом декодируется обратно. Разработчикам, стремившимся постичь суть формата, доводилось действовать, как говорится, по наитию. Потому в ранних версиях OpenOffice.org (предшественника LibreOffice) сложные *doc (с таблицами, рисунками и прочими объектами) нередко отображались довольно криво.

Двадцатого февраля 2008-го года планету облетела новость: международный комитет стандартизации (он же ISO) вынудил Microsoft открыть спецификации форматов Microsoft Office 2007. Однако радость оказалась преждевременной: открыли далеко не всё, оставив множество «белых пятен».

Что такое DOCX

Он же Office Open XML, он же OOXML, является родным братом (почти близнецом) Open Document Format, то бишь, ODF. (В Ubuntu вы, надо полагать, видели файлы с расширением odt, открываемые в OpenOffice.org или LibreOffice).

Формально эти форматы вроде бы разные, но суть одна: zip-архив, внутри которого содержится несколько XML-файлов с размеченным текстом, ну и прочие компоненты.

То есть, бинарный DOC, видимо, страсть как надоел даже самой конторе Microsoft , раз уж они взяли Office Open XML и сделали его форматом Word 2007 по умолчанию. А расширение таким файлам дали docx. Видимо, чтобы привычное «doc» тоже фигурировало и люди документы легко отличали от чего-либо иного.

Однако с признанием DOCX вышла неувязка. Поначалу ISO (комитет стандартизации) воспротивился. Мол, сомневаемся мы, что ваш вариант такой уж совместимый с альтернативным программным обеспечением . Кажется, вы малость схитрили, дабы монополию не терять.

Потом в ISO вроде бы успокоились, но зато возмутились местные комитеты стандартизации сразу в нескольких странах. Таких как Бразилия, Индия, Венесуэла, Дания. Чуть позже к ним присоединились ЮАР, Парагвай и Эквадор. Сказали, мол, не доверяем мы этому DOCX. А заодно и слишком сговорчивому ISO.

Так или иначе, хотя спецификации открыты, формат DOCX является проприетарным. В смысле, запатентованным. Возможность его использования всецело зависит от Microsoft.

Поэтому мир постепенно начал осознавать преимущества вышеупомянутого Open Document Format (того, который ODF). Во-первых, нет никаких патентов, бери и пользуйся как хочешь. Во-вторых, нет подвохов с совместимостью. К ним и переходим.

Менталитет монополиста

Капитализм подразумевает наличие множества небольших фирм. В том числе и таких, где считают каждую копейку. И в конторах разумно сомневаются в целесообразности ощутимых расходов на Microsoft Office . Зачем платить за дорогой софт, если есть свободный LibreOffice.

Вот тут-то, как говорится, шило и вылезло из мешка. Выяснилось, что LibreOffice открывает документы в формате DOCX запросто, а хитрый Word категорически отказывается понимать ODF. Несмотря на то, что DOCX и ODF - чуть ли не близнецы, как сказано ранее.

То есть, Microsoft, не желая распространения бесплатного LibreOffice как альтернативы недешёвому MS Office, препятствует использованию ODF в своих программных продуктах. И, вполне вероятно, делает это намеренно.

Следовательно, хотя Office Open XML существует где-то с 2006-го года, устаревший бинарный DOC выбросить на свалку истории не получается. Ведь ради последующего открытия в Word 2007 и Word 2010 разнообразные файлы, изготавливаемые в LibreOffice, доводится сохранять либо в RTF (небольшие), либо в DOC, увы.

Как с этим жить

В Российской Федерации Open Document Format стал официально узаконенным стандартом. Теперь ни один чиновник государственного учреждения не вправе заявить, мол, присылайте нам документы только в DOC и DOCX, а ваших ODF мы знать не желаем. Значит, путь для массового использования LibreOffice открыт.

В других странах, где законодательство пока иное, можно самостоятельно стремиться сделать Open Document Format популярным стандартом де-факто, не дожидаясь признания де-юре.

Каким образом? Просто использовать LibreOffice и рассказывать об этом бесплатном пакете приложений коллегам, деловым партнёрам, друзьям-приятелям, собеседникам в социальных сетях.

Почему нужно продвигать альтернативу? Вовсе не потому, что ODF чем-то лучше DOCX, они ведь очень похожи. А потому, что привязка всего мира к продукту корпорации-монополиста - это не очень хорошо.

Предыдущие публикации:

Последнее редактирование: 2012-11-03 21:57:20

Метки материала: ,

Начиная с 2007 года обновленная версия Word (и Microsoft Office) для сохранения файлов стала использовать формат DOCX, вместо классического DOC. Это была не просто «экстремальная» версия формата 1990-х годов, дополнительный X в расширении обозначает стандарт Office Open XML.

В чём разница, и какой из них следует использовать? DOC – это формат документа, используемый Microsoft Word, а DOCX – его преемник. Оба являются относительно открытыми, но DOCX более эффективен и создает меньшие, менее повреждаемые файлы.

Если у Вас есть выбор, используйте DOCX, DOC необходим только в том случае, если файл будет использоваться версиями Word до 2007 года.

Краткая история формата DOC

Microsoft Word начал использовать формат DOC и соответствующее расширение файла более 30 лет назад в самом первом выпуске Word для MS-DOS. Word исполнял роль проприетарного процессора документов, формат также был проприетарным: Word был единственной программой, официально поддерживающей файлы DOC, до тех пор, пока Microsoft не откроет спецификацию в 2006 году, после чего она была перепроектирована.

В 90-х и начале 2000-х годов различные конкурирующие продукты могли работать с файлами DOC, хотя некоторые из более экзотических форматов и опций Word не поддерживались в других текстовых процессорах. Поскольку Office и Word были де-факто стандартами для офисных наборов , соответственно, закрытый характер формата файла, несомненно, помог Microsoft сохранить свое господство над такими продуктами, как Corel WordPerfect.

С 2008 года Microsoft несколько раз выпускала и обновляла спецификацию формата DOC для использования в других программах, хотя не все расширенные функции Word поддерживаются открытой документацией.

После 2008 года формат DOC был интегрирован в платные и бесплатные программы обработки текстов многих поставщиков. Это значительно упростило работу с более старыми форматами текстовых процессоров, и многие пользователи по-прежнему предпочитают сохранять документы в старом стандарте DOC.

Введение Office Open XML (DOCX)

Под давлением растущей конкуренции открытого исходного кода и его конкурирующего формата открытых документов (ODF), Microsoft приняла решение о введение открытого стандарта в начале 2000-х годов. Это привело к разработке формата файла DOCX вместе со своими компаньонами, такими как XLSX для электронных таблиц и PPTX для презентаций.

Стандарты были представлены под названием «Office Open XML» (не имеет отношения к программе Open Office), поскольку форматы были основаны на Extensible Markup Language, а не на более раннем и менее эффективном двоичном формате. Этот язык позволил получить несколько преимуществ, в первую очередь, меньшие размеры файлов, меньше шансов на взлом и сжатые изображения.

Формат DOCX на основе XML стал стандартом для Word в версии программного обеспечения 2007 года. В то время многие пользователи полагали, что новый формат DOCX был просто средством для Microsoft поэтапного отказа от более старых версий программного обеспечения и продажи новых копий, поскольку более старые версии Word и Office не могли читать новый XML файлы.

Это было не совсем так: Word 2003 может читать специальные форматы файлов Word XML, а обновления совместимости позднее были применены к другим версиям. Но, в любом случае, некоторые пользователи вручную сохраняли файлы в более раннем стандарте DOC вместо DOCX ради совместимости.

Десять лет спустя DOCX стал новым стандартом де-факто, хотя он не столь универсален, как более старый формат DOC-файлов, благодаря конкурентам, таким как ODF, и общему уменьшению традиционного использования текстового процессора.

Какой из них следует использовать

DOCX – лучший выбор для любой ситуации . Формат создает меньшие, более легкие файлы, которые легче читать и передавать. Открытый характер стандарта Office Open XML означает, что его можно прочитать практически любым полнофункциональным текстовым редактором, включая онлайн-инструменты, такие как Google Docs.

Единственной причиной использования старого формата DOC может быть восстановление некоторых файлов старше десяти лет или работа с очень устаревшим текстовым процессором.

Скачать файл в формате.doc”, “скачать файл в формате.docx”, “сохранить в…”, “открыть с помощью…”. Разница в одну букву порой способна доставить много головной боли, если интернет-сервис принимает только определенный формат текстового файла или создается он на одном компьютере, а открывается на другом. Сегодня актуальны и файлы с именем с расширением.doc, и файлы с расширением имени.docx, однако ввиду постепенного обновления ПО первых становится все меньше.

DOC — расширение имени текстового файла, используемое текстовым процессором Microsoft Word, ставшее впоследствии обозначением серии собственных форматов.
DOCX (Office Open XML) — форматы файлов, применяемые для хранения электронных документов, созданных пакетом офисных приложений от Microsoft.

Разница между doc и docx

Разница между doc и docx заключается, в первую очередь, в возможности работы с ними пакетов программ. Формат doc подчиняется всем текстовым редакторам от Microsoft по умолчанию, не требуя надстроек, формат docx же Microsoft Word в версии 2003 года и ранних не воспринимается, его поддержка начинается в версии Word 2007. Решается вопрос с помощью дополнительного конвертера.
Несоответствие docx Word 2003 объясняется тем, что этот формат файлов предполагает сжатие, и сам по себе является zip-архивом, внутри которого содержатся собственно текстовый документ в виде XML, графика и файлы, определяющие свойства документа и отношения между содержимым контейнера. Версия 2003 не может его распаковать. Сжатие определяет и одно из основных отличий между форматами doc и docx — размер файла в последнем случае несколько меньше.
В сторонних текстовых процессорах docx поддерживается опционально, но в самом популярном из них пакете OpenOffice такая поддержка имеется. Формат doc без танцев с бубнами со сторонними редакторами совместим плохо. Docx не работает с языками с начертанием справа налево. Кроме того, в ряде случаев формат docx поддерживает только собственные форматы Microsoft, игнорируя стандарты: к примеру, вместо SVG — WMF.

TheDifference.ru определил, что отличие doc от docx заключается в следующем:

Файл формата doc можно открыть любой версией текстового процессора от Microsoft, файл docx — только версиями Word начиная от 2007.
Docx — zip-контейнер для файлов XML.
Doc не поддерживает сжатие.
Doc плохо совместим со сторонними редакторами.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows