Тэкставы файл — камп’ютарны файл, які змяшчае тэкставыя даныя, звычайна пададзеныя ў выглядзе радкоў.
Тэкставым файлам супрацьпастаўляюцца двайковыя файлы, у якіх змяшчаюцца даныя, не разлічаныя на іх разгляд у якасці тэксту (напрыклад, файлы, якія захоўваюць гук ці відарыс).
У адрозненне ад тэрміна «тэкставы фармат», які апісвае змест даных, тэрмін «тэкставы файл» датычыцца іменна файла і апісвае яго як ёмістасць, што захоўвае такія даныя.
Апісанне
Тэкставы файл уяўляе сабой паслядоўнасць сімвалаў (у асноўным друкавальных знакаў, якія належаць таму ці іншаму набору сімвалаў). Гэтыя сімвалы звычайна згрупаваны ў радкі (англ.: lіnes, rows). У сучасных сістэмах радкі падзяляюцца , у мінулым мела месца захоўванне радкоў у выглядзе запісаў сталай ці зменнай даўжыні (гл.: ). Часам канец тэкставага файла (асабліва калі ў файлавай сістэме не захоўваецца інфармацыя аб памеры файла) таксама адзначаецца адным ці болей адмысловымі знакамі, вядомымі як меткі або маркеры .
Тэкставы файл можа змяшчаць як фарматаваны, так і нефарматаваны тэкст.
Перавагі і недахопы
Перавагі:
- Універсальнасць — тэкставы файл можна прачытаць (так ці інакш) на любой сістэме ці АС, асабліва калі гаворка ідзе аб аднабайтных кадыроўках на ўзор , якія звычайна не выклікаюць праблемы, якая можа ўзнікаць пры выкарыстанні іншых фарматаў файлаў — для іх не мае значэння розніца ў ці даўжыні на розных платформах.
- Устойлівасць — кожнае слова і сімвал у такім файле самадастатковыя, і, калі здарыцца пашкоджанне байтаў у такім файле, то звычайна лягчэй аднавіць даныя і працягнуць апрацоўку астатняга зместу, у той час як у сціснутых ці двайковых файлах пашкоджанне некалькіх байтаў можа прывесці да немагчымасці аднавіць увесь змест файла. Многія сістэмы кіравання версіямі разлічаны на тэкставыя файлы і з двайковымі файламі могуць працаваць толькі як з адзіным цэлым.
- Фармат тэкставага файла надзвычай просты і яго можна змяняць тэкставым рэдактарам — праграмай, якая ўваходзіць у склад практычна любой АС.
Недахопы:
- У вялікіх нясціснутых тэкставых файлаў нізкая — гэтыя файлы займаюць больш месца, чым мінімальна неабходна. Хоць гэта лішкавасць і надае павышаную ўстойлівасць да збояў у каналах перадачы даных і пры атрыманні даных з , напрыклад, з магнітнай стужкі.
- Некаторыя аперацыі з тэкставымі файламі неэфектыўныя. Напрыклад, калі ў файле сустрэнецца лік, вылічальная сістэма да пачатку аперацый з ім павінна будзе перавесці яго ў свой унутраны фармат, ужыўшы адносна складаную працэдуру пераводу ліку; каб перайсці на 1000-ы радок, трэба прачытаць 999 радкоў, якія ідуць перад ім; складана замяніць адзін радок на іншы і г. д. Таму пры рабоце з вялікімі аб'ёмамі даных тэкставыя файлы ўжываюць толькі як прамежкавы фармат.
Фарматы, заснаваныя на тэкставых файлах
З прычыны сваёй прастаты тэкставыя файлы нярэдка выкарыстоўваюцца для захоўвання службовай інфармацыі (напрыклад, ). Тэкставы фармат служыць асновай для многіх адмысловых (напрыклад, , , HTML, XML, TeX, зыходных тэкстаў моў праграмавання).
У тэкставым файле тэкст можна захоўваць як у нефарматаваным, так і фарматаваным ці размечаным выглядзе (напрыклад, , HTML), дзе к кожнаму асобнаму сімвалу можна прымяніць (шрыфт, напісанне, памер і інш.).
Пашырэнні імён файлаў
У DOS і Windows для файлаў з нефарматаваным тэкстам звычайна выкарыстоўваецца .txt. Тым не менш, тэкставымі могуць з'яўляцца файлы з любым іншым пашырэннем ці без яго. Напрыклад, зыходныя коды праграм звычайна захоўваюцца ў файлах з пашырэннямі, якія адпавядаюць мове праграмавання, на якой напісаны праграмы (.bas, .pas, .c).
Фарматаваны тэкст (тэкст с разметкай) звычайна захоўваецца ў файлах з пашырэннем, якое адпавядае фармату ці — .rtf, .htm, .html.
Кадзіраванне тэксту
8-бітны тэкст
Гістарычна для кадзіравання тэкставых файлаў выкарыстоўваўся 7-бітны набор сімвалаў ASCII, а таксама 8-бітныя і разнастайныя пашырэнні ASCII. У 8-бітных кодавых старонках агульнапрынята размяшчаць у першай палове кодавай табліцы сімвалы, якія адпавядаюць ASCII.
Перавагай 8-бітнага падання тэксту з'яўляецца праграмная прастата і незалежнасць ад праблемы ці даўжыні на розных платформах. Недахоп — вялікая колькасць разнастайных стандартаў, што можа прыводзіць да .
Unіcode ў тэкставых файлах
Выкарыстанне ў тэкставых файлах хоць у асноўным вырашае «праблему кадзіровак» і стандартызуе ўжыванне кіруючых сімвалаў, але стварае свае праблемы. У большасці сучасных сістэм найменшай непадзельнай адзінкай інфармацыі ў патоку даных ёсць байт (8 біт), а для кадзіравання аднаго сімвала з Унікода патрэбна некалькі байтаў. Праблема вырашаецца шляхам ужывання несумяшчальных паміж сабой сістэм і дзвюх версіі (UTF-16LE і UTF-16BE з процілеглым ). Часам у пачатак файла дадаюць адмысловы сімвал-метку (U+FEFF), які дазваляе дакладна распазнаць фармат. UTF-8 мае перавагу адваротнай сумяшчальнасці з ASCII, аднак праграмная апрацоўка тэксту ў UTF-8 ускладняецца зменным памерам сімвала. Таксама, тэксты ў Унікодзе адрозніваюцца яшчэ большай , чым 8-бітныя.
Кіруючыя сімвалы
Розныя аперацыйныя сістэмы прытрымліваюцца свайго прадстаўлення сімвалаў перавода радка і канца файла. У Unix перавод радка складаецца з аднаго сімвала LF (код 10), у Mac OS — з сімвала CR (код 13), а ў DOS і Windows перавод радка кадзіруецца паслядоўнасцю двух сімвалаў: CR і LF.
Апроч названых, у тэкставых файлах ужываюцца такія сімвалы, як (код 9) і перавод старонкі (код 12).
Гл. таксама
Зноскі
- Стандарт Unіcode, ч. 2.(недаступная спасылка)
Вікіпедыя, Вікі, кніга, кнігі, бібліятэка, артыкул, чытаць, спампоўваць, бясплатна, бясплатна спампаваць, mp3, відэа, mp4, 3gp, jpg, jpeg, gif, png, малюнак, музыка, песня, фільм, кніга, гульня, гульні, мабільны, тэлефон, Android, iOS, Apple, мабільны тэлефон, Samsung, iPhone, Xiomi, Xiaomi, Redmi, Honor, Oppo, Nokia, Sonya, MI, ПК, Інтэрнэт, кампутар
Tekstavy fajl kamp yutarny fajl yaki zmyashchae tekstavyya danyya zvychajna padadzenyya y vyglyadze radkoy Tekstavym fajlam supracpastaylyayucca dvajkovyya fajly u yakih zmyashchayucca danyya ne razlichanyya na ih razglyad u yakasci tekstu napryklad fajly yakiya zahoyvayuc guk ci vidarys U adroznenne ad termina tekstavy farmat yaki apisvae zmest danyh termin tekstavy fajl datychycca imenna fajla i apisvae yago yak yomistasc shto zahoyvae takiya danyya ApisanneTekstavy fajl uyaylyae saboj paslyadoynasc simvalay u asnoynym drukavalnyh znakay yakiya nalezhac tamu ci inshamu naboru simvalay Getyya simvaly zvychajna zgrupavany y radki angl lines rows U suchasnyh sistemah radki padzyalyayucca u minulym mela mesca zahoyvanne radkoy u vyglyadze zapisay stalaj ci zmennaj dayzhyni gl Chasam kanec tekstavaga fajla asabliva kali y fajlavaj sisteme ne zahoyvaecca infarmacyya ab pamery fajla taksama adznachaecca adnym ci bolej admyslovymi znakami vyadomymi yak metki abo markery Tekstavy fajl mozha zmyashchac yak farmatavany tak i nefarmatavany tekst Peravagi i nedahopy Peravagi Universalnasc tekstavy fajl mozhna prachytac tak ci inaksh na lyuboj sisteme ci AS asabliva kali gavorka idze ab adnabajtnyh kadyroykah na yzor yakiya zvychajna ne vyklikayuc prablemy yakaya mozha yznikac pry vykarystanni inshyh farmatay fajlay dlya ih ne mae znachennya roznica y ci dayzhyni na roznyh platformah Ustojlivasc kozhnae slova i simval u takim fajle samadastatkovyya i kali zdarycca pashkodzhanne bajtay u takim fajle to zvychajna lyagchej adnavic danyya i pracyagnuc apracoyku astatnyaga zmestu u toj chas yak u scisnutyh ci dvajkovyh fajlah pashkodzhanne nekalkih bajtay mozha pryvesci da nemagchymasci adnavic uves zmest fajla Mnogiya sistemy kiravannya versiyami razlichany na tekstavyya fajly i z dvajkovymi fajlami moguc pracavac tolki yak z adzinym celym Farmat tekstavaga fajla nadzvychaj prosty i yago mozhna zmyanyac tekstavym redaktaram pragramaj yakaya yvahodzic u sklad praktychna lyuboj AS Nedahopy U vyalikih nyascisnutyh tekstavyh fajlay nizkaya getyya fajly zajmayuc bolsh mesca chym minimalna neabhodna Hoc geta lishkavasc i nadae pavyshanuyu ystojlivasc da zboyay u kanalah peradachy danyh i pry atrymanni danyh z napryklad z magnitnaj stuzhki Nekatoryya aperacyi z tekstavymi fajlami neefektyynyya Napryklad kali y fajle sustrenecca lik vylichalnaya sistema da pachatku aperacyj z im pavinna budze peravesci yago y svoj unutrany farmat uzhyyshy adnosna skladanuyu praceduru peravodu liku kab perajsci na 1000 y radok treba prachytac 999 radkoy yakiya iduc perad im skladana zamyanic adzin radok na inshy i g d Tamu pry raboce z vyalikimi ab yomami danyh tekstavyya fajly yzhyvayuc tolki yak pramezhkavy farmat Farmaty zasnavanyya na tekstavyh fajlah Z prychyny svayoj prastaty tekstavyya fajly nyaredka vykarystoyvayucca dlya zahoyvannya sluzhbovaj infarmacyi napryklad Tekstavy farmat sluzhyc asnovaj dlya mnogih admyslovyh napryklad HTML XML TeX zyhodnyh tekstay moy pragramavannya U tekstavym fajle tekst mozhna zahoyvac yak u nefarmatavanym tak i farmatavanym ci razmechanym vyglyadze napryklad HTML dze k kozhnamu asobnamu simvalu mozhna prymyanic shryft napisanne pamer i insh Pashyrenni imyon fajlay U DOS i Windows dlya fajlay z nefarmatavanym tekstam zvychajna vykarystoyvaecca txt Tym ne mensh tekstavymi moguc z yaylyacca fajly z lyubym inshym pashyrennem ci bez yago Napryklad zyhodnyya kody pragram zvychajna zahoyvayucca y fajlah z pashyrennyami yakiya adpavyadayuc move pragramavannya na yakoj napisany pragramy bas pas c Farmatavany tekst tekst s razmetkaj zvychajna zahoyvaecca y fajlah z pashyrennem yakoe adpavyadae farmatu ci rtf htm html Kadziravanne tekstu8 bitny tekst Gistarychna dlya kadziravannya tekstavyh fajlay vykarystoyvaysya 7 bitny nabor simvalay ASCII a taksama 8 bitnyya i raznastajnyya pashyrenni ASCII U 8 bitnyh kodavyh staronkah agulnaprynyata razmyashchac u pershaj palove kodavaj tablicy simvaly yakiya adpavyadayuc ASCII Peravagaj 8 bitnaga padannya tekstu z yaylyaecca pragramnaya prastata i nezalezhnasc ad prablemy ci dayzhyni na roznyh platformah Nedahop vyalikaya kolkasc raznastajnyh standartay shto mozha pryvodzic da Unicode y tekstavyh fajlah Vykarystanne y tekstavyh fajlah hoc u asnoynym vyrashae prablemu kadzirovak i standartyzue yzhyvanne kiruyuchyh simvalay ale stvarae svae prablemy U bolshasci suchasnyh sistem najmenshaj nepadzelnaj adzinkaj infarmacyi y patoku danyh yosc bajt 8 bit a dlya kadziravannya adnago simvala z Unikoda patrebna nekalki bajtay Prablema vyrashaecca shlyaham uzhyvannya nesumyashchalnyh pamizh saboj sistem i dzvyuh versii UTF 16LE i UTF 16BE z procileglym Chasam u pachatak fajla dadayuc admyslovy simval metku U FEFF yaki dazvalyae dakladna raspaznac farmat UTF 8 mae peravagu advarotnaj sumyashchalnasci z ASCII adnak pragramnaya apracoyka tekstu y UTF 8 uskladnyaecca zmennym pameram simvala Taksama teksty y Unikodze adroznivayucca yashche bolshaj chym 8 bitnyya Kiruyuchyya simvaly Roznyya aperacyjnyya sistemy prytrymlivayucca svajgo pradstaylennya simvalay peravoda radka i kanca fajla U Unix peravod radka skladaecca z adnago simvala LF kod 10 u Mac OS z simvala CR kod 13 a y DOS i Windows peravod radka kadziruecca paslyadoynascyu dvuh simvalay CR i LF Aproch nazvanyh u tekstavyh fajlah uzhyvayucca takiya simvaly yak kod 9 i peravod staronki kod 12 Gl taksamaZnoskiStandart Unicode ch 2 nedastupnaya spasylka