Avatar uživatele
quentos

Ve kterém formátu ukládat důležité písemné dokumenty?

Dejme tomu překlad, na němž se pracuje několik let. Svůj úplně první takový jsem ukládal v doc. Pak se mi podělal a bylo mi vysvětleno, že formát .doc je nespolehlivý a ať ukládám v .odt. Jenže uplynulo dalších pár let a .odt se mi podělal taky. Stejná chybová hláška – „soubor je asi poškozen, nelze ho otevřít“. Existuje formát textových dokumentů, u nějž toto nehrozí? PDF není vyhovující, protože jak překlad přibývá, dokument každou chvíli aktualizuju. Díky.

Zajímavá 7Pro koho je otázka zajímavá? anonym, Hlada, cynique, Kepler, nyjono, aliendrone, paroh77 před 1758 dny Sledovat Nahlásit



Nejlepší odpověď
Avatar uživatele
aliendrone

Zamysli se – „nespolehlivý formát“? Pokud nejdou uložená data načíst, je nespolehlivé paměťové médium. (A to je BĚŽNÉ!) :)

No, já ti místo změny formátu poradím spíš zrenundovat zálohy. Ono je to často LEPŠÍ, než se prudit s jiným formátem (a případně konvertovat). Typicky můžeš zálohovat do NAS (pokud máš) a do cloudu (ten je spolehlivě renundován). I zdarma G-disk s velikostí 15GB ti na texty bohatě stačí. Pokud potřebuješ více, existují i jiné free cloudy, další možnost je zakoupení dodatečného prostoru (je to laciné, neboj nic 50 GB: 25Kč, 200 GB: 79Kč, 2 TB: 249Kč za měsíc).

Další možností je diskové pole RAID 1 (nebo 1+0), zkrátka je podle mne lepší znásobit zálohu, než se prudit s konverzemi formátů.

BTW > Ono to vůbec nemusí být formátem souboru. Staré, hodně „jeté“ SSD mívají potíže (zvláště pokud jsou TLS) a jestli zálohuješ/ukládáš na DVD+/-R (nedejbože na RW), tak taková záloha NENÍ už z principu na dlouho, jsou i případy, kdy se placka/některé soubory odmítla načíst už měsíc po vypálení (přičemž kontrola po vypálení 100% a média byla dobře skladována) – vlastní zkušenost. :( Zkus použít DTD (data tresor disk) média a jeho varianty, tady ale nejdřív musíš vyzkoušt, jestli to tvá vypalovačka zvládne vyburnit (ne všechny to zvládnou), pokud ano, tak jsi za vodou navzdory vyšší ceně médií. Jistota, že se „to nepodělá“ za těch pár kaček stojí. :)

0 Nominace Nahlásit

Další odpovědi
Avatar uživatele
Kepler

Se spolehlivostí textových formátů nemám zkušenosti. Ukládám v .odt a ještě nikdy se mi nic nepodělalo. Přesto je dobré mít na důležité soubory zálohu. Když budu chtít něco tisknout, převedu si to do .pdf jako zálohu, tak se mi vytiskne vše přesně tak, jak je vše uspořádáno. Případné změny v textu dělám v původním .odt.

0 Nominace Nahlásit


Avatar uživatele
Dochy

txt je nejspolehlivější 😉
Ale obávám se, že asi neřeší Tvé potřeby. V každém případě každá editace (tj. otevření a modifikace souboru) nesou jisté riziko že se něco podělá. Doporučuju zálohovat, pak v případě potíží se dostaneš alespoň zpět ke včerejší verzi.

0 Nominace Nahlásit

Avatar uživatele
Vojta24

Ge0rge, už to sem napsat nemůže, protože si vyplácal limit počtu editací odpovědí 🙂. Tak mu prokážu dobrodiní, a udělám to za něj.

Optimální zdrojový formát by měl být tedy MARKDOWN TXT jak píše v diskusi, a protože s tím vesměs souhlasím mohu se pod to podepsat zrovna tak. Je to vlastně jak píše DOCHY jen obyčejný TXT který přetrvá navěky, ale je navíc obohacený právě o tu možnost určit co je nadpis, co je odstavec, co je odrážkový seznam, a to poměrně dost jednoduchým způsobem. Takový zápis se pak snadno dá převést do libovolného jiného formátu, který dnes nebo třeba za sto let bude běžně akceptován.

Upravil/a: Vojta24

0 Nominace Nahlásit

Avatar uživatele
Klaproth

Je nutné nejprve pořešit spolehlivost záznamového média. Formát v tom nehraje až tak zásadní roli. Když jsem se motal okolo tiskařiny, bylo vše ve formátu .rtf a problémy s ním nebyly.

0 Nominace Nahlásit

Avatar uživatele
anonym

HTML 🙂 natolik jednoduchý, že i přes dekády se v něm nic zásadního nemění

Jinak souhlas s dochy, TXT je jistota, ale nedisponuje vůbec žádnou semantikou, takže neoznačíš odstavce, nadpisy, nic … plus, mohou se objevit problémy s kodováním češtiny (nikoliv neřešitelné samozřejmě), stejně jako se dodnes setkváme s TXT které jsou v 8 bitových národních kódováních a pro smysluplné, přesnositelné a multiplatformní využití je obvykle musíme konvertovat do unicode (UTF-8/16), podobný problém můžeš za pár let řešit znovu, každopádně konverze kódování je jistě jenodušší než řešení zpracování nekompatibilního a příliš komplexního formátu.

HTML je domnívám se vhodný kompromis. Jednoznačně snadno přenostitelný napříč časem i různými platformami, editovatelný téměř na čemkoliv. Bez jakéhokoliv omezení velikosti, s komplexními možnostmi formátování vyplývající se semantiky dokumentu (podobně jako styly v textovém editoru můžete vzhled celého dokumentu html snadno měnit pomocí stylů zapsaných v jednoduchém opět jen txt souboru ve formátu css) což se dá udělat klidně až dodatečně a do té doby prostě jen standardně značkovat nadpisy, odstavce, odrážkové seznamy, tabulky bez jakéhokoliv určení specifického stylu a to v jednoduchých html editorech (bluegriffon.org nebo bluefish, vždy nějaký wysiwyg html editor bude existovat to nikdy nezanikne, možná i za sto let, natolik je tento formát stabilně zakotvený v řadě dalších technologií, které na něm doslova závisí) …

Jinak k poznámce že doc není spolehlivý, jistě to je pravda, dokud šlo o proprietární formát bylo velmi nejísté zda taková data otevřete i za pár let, doc tedy skutečně nebrat. O DOCX už bych ale možná i zauvažoval, protože od uršité verze se jedná o ISO standard, stejně jako ODT (resp. celá rodina OpenDocumentFormat obecně, nikoliv jen OpenDocumentText) je od určité verze rovněž ISO standardem (ISO/IEC 26300). Domnívám se že tyto dva formáty už by se neměli tak dramaticky měnit, standard je přece pevně daný.

Kritici (a jsou mezi nimi i tací jako třeba IBM) však poukazují na to že DOCX je záměrně naprosto zbytečně překombinovaný standard ve srovnání průzračně jednoduchým ODT. IBM vznesla podezření že microsoft publikoval svůj iso standard DOCX na 6tis. stránkách v podstatě jen proto aby nadále zůstal jediným kdo jej bude schopen plnohodnotně implementovat 🙂 což asi není moc daleko od pravdy. Microsoft tyto prakticky za Balmera skutečně dost běžně používal a konkurenci házel klacky pod nohy pomocí prznění standardů dost běžně. Proti tomu OpenDocument iso standard je přehledně popsán pouze na 350 stránkách, a přítom je po technické stránce naprosto srovnatelný, dovedete si asi představit kolik do své specifikace microsoft musel přidat zbytečného balastu aby dosáhl zvýšení ze 350 stran na 6tis 😁 … osobně bych tedy DOCX nevolil, ale iso standard to je také, jen s určitým ALE.

Upravil/a: anonym

0 Nominace Nahlásit


Diskuze k otázce
Avatar uživatele
quentos

Samozřejmě zálohuju. Ale znáte to, záloha je ve stejném formátu…

před 1755 dny Odpovědět Nahlásit
Avatar uživatele
cochee

„Renundovat?“

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
aliendrone

https://cs.wi­kipedia.org/wi­ki/Redundance

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
quentos

… no právě. V redundanci jsou celkem dvě D, kdežto to tvoje sloveso vypadá úplně jinak…

před 1754 dny Odpovědět Nahlásit
Avatar uživatele
Dochy

Nemyslím, že by toto potřeboval cochee vysvětlovat 😉

před 1756 dny Odpovědět Nahlásit
Avatar uživatele
aliendrone

Da, ja uže póňjal, iznvinítě, mojá ošíbka! :)
Tywoe ale trvalo mi to teda DLOUHO a nebýt quentose, možná (určitě ;) ) by mě to ani netrklo.

Odvolávám co jsem provolal (napsal) a slibuji (+ quentosovi doporučuji zálohy) REDUNDOVAT.

Ale i tak díkes za upozornění, syntaktickou chybu v odpovědi neopravím, potože by následně tato diskuze přestala dávat smysl, což by byla (podle mne) ještě VĚTŠÍ chyba! Není nad poučení z chyb a jsou i tací, kteří se dokáží poučit i z chyb ostatních. (je jich málo, ale JSOU) :)

Venkoncem i tak > „Wild boys always shine!“ ;) :)

před 1754 dny Odpovědět Nahlásit
Avatar uživatele
anonym

Teď mne ale napadl ještě jeden formát, který bys mohl využít a který má slušnou trvanlivost. V podstatě jen rozšiřuje TXT o semantiku (definici nadpisů, odstavců, odrážkových seznamů), takže nadále můžeš používat jakýkoliv primitivní editor prostého textu (notepad apod.) … hovořím o formátu Texty! českého autora Davida Grudla. Vyzkoušej jeho možnosti sám v tomto demu https://texy.in­fo/cs/try

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
anonym

Ještě lépe pak obdobný formát který je celosvětovou obdobou Texy!, který se jmenuje Markdown viz https://cs.wi­kipedia.org/wi­ki/Markdown (česká wiki)

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
anonym

pro značkované Markdown TXT existuje obrovské množství online editorů, skutečně nepřeberné množství, namátkou zkus třeba https://stacke­dit.io/app nebo https://alter­nativeto.net/sof­tware/stackedit/ .. toto je možná ta nejlepší volba, škoda že se mi už nevešla do odpovědi (resp. nemohu ji už editovat)

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
anonym

Markdown TXT má totiž stejné přednosti jako HTML (jednoduchost semantického značkování, jednoduchý a v podstatných věcech prakticky neměnný standard) přitom se Markdown TXT o něco jednodušeji píše v editorech prostého textu … je jistě přirozenější napsat nadpis tak že ho podtrhnete znaky = než že jej ohradíte značkami <h1>Nadpis</h1> … je to takové přirozenější , přitom se kdykoliv dá snadno Markdown TXT do HTML či kteréhokoliv jiného formátu konvertovat ! Je to ideální zdrojový formát.

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
quentos

Dík, zkusím :{)>

před 1755 dny Odpovědět Nahlásit
Avatar uživatele
anonym

Jinak díky za jeden z mála skutečně zajímavých dotazů, toto má být dotaz+ 🙂

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
Hlada

Opravdu zajímavý dotaz i zajímavé odpovědi, z kterých jsem se dověděl něco nového. Nenapadlo mě řešit spolehlivost zálody změnou formátu. V této souvislosti by mě zajímalo, jestli čitelnost poškozených dat je v různých formátech také různá. Doposud jsem měl za to, že když něco nejde přečíst, jsou data vadná a jednoduše to otevřít nejde.

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
Dochy

TXT i při změně dat stále otevřít jde pokud jej půjde z disku vytáhnout (jen vyjímečně některý editor může mít s některými náhodně vzniklými daty potíže) – jen v poškozené části budou nesmysly, ostatní se zobrazí správně. To samé by mělo platit i pro HTML. DOC, DOCX, ODT apod – tam v případě „náhodné“ změny dat je již velká pravděpodobnost že kvůli složitosti formátu si s tím aplikace už neporadí.

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
anonym

Správně jsi vyhodnotil že pdf na toto vhodný skutečně není, není pro tento účel ani určen, nedokáže dokonce ani držet semantickou informaci, neví co je odstavec, netuší co je nadpis, je to jen tiskový formát, většinou vše drží v křivkách a dodatečné editace bývají dost problematické. Toto prostě není účel PDF. Když to trochu přeženu, je to stejné jako bys pracovní dokument ukládal do TIFF nebo JPEG 🙂 asi by to technicky šlo, ale opravdu to není ono.

před 1757 dny Odpovědět Nahlásit
Avatar uživatele
Dochy

V PDF může být zapouzdřeno téměř cokoli. Určitě tam může být i klasický strukturovaný text (u rozumně vytvořeného PDF také není problém třeba s textovým vyhledáváním – zatímco u „nerozumně“ vytvořeného vyhledavačem nenajdeš ani to slovo na které zrovna civíš…). Nicméně je fakt že to není formát primárně určený pro tvorbu a editaci dokumentů

před 1757 dny Odpovědět Nahlásit
Nový příspěvek