Pogovor:UTF-8

Ehm. Zapisano pravzaprav ne drži. ISO 10646/Unicode/UCS je kodirani nabor znakov - preslikava, ki določeni kodi pripiše dano pismenko. UTF-8 (pa tudi UTF-7, UTF-16 ipd.) pa je samo način, kako kode predstaviti na način, združljiv z ASCII. "Surove" kode UCS namreč vsebujejo bajte, ki bi lahko zmedle programe, ki berejo tok bajtov - deli kod UCS so lahko tudi bajti, ki se samostojno preberejo kot NUL, / ali \ (znak NUL zaključuje niz znakov v C, poševnici se uporabljata za razmejitev podimenikov). Druga težava UCS je ta, da spoštujejo različni tipi procesorjev različne dogovore o tem, kateri bajt večbajtnega števila leži na spodnji pomnilniški lokaciji. UTF-8 prekodira kode UCS v nedvoumna zaporedja bajtov. Slaba tega je, da zdaj niso več vsi znaki enako dolgi - slovenske črke Č, Š in Ž zavzemajo dva bajta, ostali znaki abecede pa po enega. Štetje znakov v datoteki je tako malo težje. --Peterlin 07:05, 19 Sep 2003 (UTC)

Bi koga zelo motilo, če to stran premaknemo na primernejši naslov (npr. >>Tabela ISO10646/Unicode<< - mislim da je to, nisem pa imel živcev čakati, da bi se stran naložila do konca), sem pa napišemo nekaj o tem, kaj pravzaprav v resnici je UTF-8? --Peterlin 11:10, 16 apr 2004 (CEST)

Ne, mene ne. Glede dolžine in smisla navedenih kod (trenutno le kot test) glej prosim še Pogovor:Merkur (planet)#. --XJam 11:23, 16 apr 2004 (CEST)

Strinjam se z obema Primoževima trditvama:

da je tabelo treba premakniti na posebno stran in
da je uvodni stavek napačen in ga je treba popraviti.

--romanm (pogovor) 12:39, 19 avg 2004 (CEST)

Igor je želel imeti tabelo z označenimi kodami, ki se ne prikazujejo pravilno, Primož pa je menil, da se prestavi. Že dvema človekoma je težko ugoditi, kaj šele 14. ali večim. To delno dopolni prvo trditev.

Za razrešitev druge trditve se ne čutim dovolj strokovnjaka za te in takšne kode, nabore, ... Upam, da je vsaj del zodovine kolikor toliko v skladu s tedanjimi dejanskimi dogajanji, saj je povzeta iz neposrednega vira (Rob Pike - dogodki/Ken Thompson - deli kode). --XJam 12:54, 19 avg 2004 (CEST)

Tabelo sem prestavil na UTF-8/Znaki, čeprav bi sodila na Unicode/Znaki (ampak Unicode še ne obstaja). Igor lahko pobarva znake, ki se ne vidijo dobro, če želi. V trenutnem članku o UTF-8 mi ni všeč tista koda - če bo kdo to rabil, bo že našel na internetu, bolje bi bilo napisati kako je res UTF-8 razdeljen; na tiste, ki se v dvojiškem zapisu začnejo z 0*, pa 110*-10*, itd. --romanm (pogovor) 13:28, 19 avg 2004 (CEST)

V redu. Kaj lahko naredimo s kodo. Ni rečeno, da jo bo kdo čez čas še našel. Pa saj sta le dve funkciji brez zaglavij, ... Ali se ju da še kako 'zbiti', ali ju vržemo ven. Koda (oziroma del kot ponazoritev) je PMSM enako kot slika vredna več kot 100/1000 besed. Glede ostalega, se bo še kdo našel, da napiše kaj o razdelitvi UTF-. --XJam 13:51, 19 avg 2004 (CEST)

Kodo bi vrgel ven. PMSM koda še zdaleč ni tako ilustrativna kot so slike oz. celo manj kot človeško berljivo besedilo. --romanm (pogovor) 13:56, 19 avg 2004 (CEST)

Prav. --XJam 14:11, 19 avg 2004 (CEST)