Metode za vnos in izpis nasih znakov, predstavljene v poglavjih o prilagoditvi tipkovnice in zaslonskih znakov, so splosne. Zato je navadno vse, kar moramo se postoriti, omogociti vnos in/ali izpis osembitnih znakov, kar za posamezni program obicajno napravimo s stikalom v datoteki z nastavitvami. Za nekatere programe so bile razvite tudi locene metode za vnos ali izpis znakov, ki v izjemnih primerih (npr. ce nimamo tipkovnice s slovenskimi znaki) lahko vseeno pridejo prav, zato so tudi navedene.
Nastavitve ukazne lupine bash
so v datoteki
~/.inputrc
(ki jo po potrebi ustvarimo):
set meta-flag on
set convert-meta off
set output-meta on
Te tri vrstice je morda pametno dodati tudi v /etc/skel
,
tako da jih podedujejo tudi vsi na novo ustvarjeni uporabniki.
Vnos osembitnih znakov omogocimo, ce v nastavitveno datoteko
(/etc/csh.login
za skupne nastavitve oz.
~/.cshrc
ali ~/.cshrc
za osebne
nastavitve) dopisemo vrstico:
setenv LC_CTYPE iso_8859_1
GNU emacs je uradni urejevalnik projekta GNU, delo Richarda M. Stallmana z MIT, ZDA.
Privzeta nastavitev urejevalnika je omejitev na sedembitne znake (ASCII). Nastavitev spremenimo tako, da v datoteko z nastavitvami dodamo naslednjih nekaj vrstic:
;; Omogocimo izpis znakov s kodo vecjo od 127
(standard-display-european t)
;; Omogocimo vnos znakov s kodo vecjo od 127
(set-input-mode (car (current-input-mode))
(nth 1 (current-input-mode))
0)
Prilagoditev Emacsa je mozno izvesti v eni od naslednjih datotek z nastavitvami:
/usr/lib/emacs/site-lisp/site-start.el
(skupne
nastavitve)~/.emacs
(osebne nastavitve)/usr/lib/emacs/site-lisp/default.el
(skupne
nastavitve)Crisp je urejevalnik v duhu urejevalnika Brief z burno zgodovino. Napisal ga je Paul Fox iz Anglije in ga distribuiral kot ``program na pokusino'' (shareware). Zadnja taksna razlicica je 2.2e iz leta 1991 in je po nekaterih vesteh avtor ne podpira vec. Novejse (trenutno 5.1) pa trzi podjetje Vital, Inc. iz Teksasa, ZDA.
Privzeta nastavitev urejevalnika Crisp 2.2e je, da znakov s
kodami od 127 dalje ne prikaze, ampak izpise njihovo
sestnajstisko kodo, ki jo uvede z znakoma \x
. Pomaga,
ce nalozimo paket z izvorno kodo Crisp in v datoteki
$(SRC)/crisp2.2e/src/crunch/tty/xterm.cr
popravimo drugi argument funkcije set_term_features()
iz
NULL
na "%c"
. Popravljeni
makroukaz prevedemo:
crunch xterm.cr
Rezultat, popravljeni xterm.cm
, postavimo med ostale,
navadno v imenik /usr/local/lib/crisp/macros/tty
.
Makro xterm
velja, kot bi iz imena sami uganili, za
Crisp, pognan v oknu XTerm znotraj X Window System. Enaka
intervencija piscu teh vrstic ni uspela na linux.cr
(konzola) in xcrisp.cr
(razlicica Crisp za X11). Poleg
tega se je na starejsi verziji Linuxa (1.0.8) crunch
pritozeval nad predprocesorjem za C, /lib/cpp
. Pomagala
je logicna povezava:
ln -s /usr/lib/gcc-lib/i486-linux/2.5.8/cpp /lib/cpp
Ales Kosir je napisal za Crisp makro slovene
:
http://lfdtb.fs.uni-lj.si/kosir/tex/tslovene/src/slovene.cr
Z njim lahko vnasamo nase znake tudi na tipkovnicah, ki nimajo
primernih tipk na nacin: namesto c vtipkamo "c
, makro
pa pretvori zaporedje v ustrezen znak. Poleg ISO Latin 1 podpira
se nekaj drugih kodiranj, ki so v uporabi v nasih krajih.
Navodila za uporabo so na voljo tudi prek WWW:
http://lfdtb.fs.uni-lj.si/kosir/tex/tslovene/slolang/node6.html
Na sistemih Linux je vi
sinonim za urejevalnik
``elvis'', delo Steva Kirkendalla.
Po izkusnjah pisca vi
sam po sebi brez tezav prepusca
osembitne znake. Tezave lahko vcasih povzrocajo zunanji
programi, ki jih klicemo iz urejevalnika (npr. fmt
za
poravnavanje besedila). Navadno pomaga, ce v
~/.profile
dolocimo spremenljivko
LC_CTYPE
(glej poglavje o
locale).
Pine najprej prebere skupne nastavitve iz
/usr/local/lib/pine.conf
(ali /etc/pine.conf
,
zatem pa se osebne nastavitve iz ~/.pinerc
. V enem ali
drugem poiscemo niz character-set
in postavimo to
spremenljivko na ISO-8859-2
:
...
# character-set should reflect the capabilities of the display
# you have. Normal default is US-ASCII. Typical alternatives
# include ISO-8859-x, where x is a number between 1 and 9.
character-set=ISO-8859-2
...
V delu.
Z ukazoma telnet
ali rlogin
lahko prek omrezja
TCP/IP delamo na drugem racunalniku.
Tezave z osembitnimi znaki pri tem so redko posledica napacne nastavitve v maloprej omenjenih programov, saj privzeti nastavitvi pri obeh podpirata osembitne znake. V primeru tezav se poleg teh programov splaca pogledati se
stty -parenb -istrip cs8
Telnet eksplicitno pripravimo do vzpostavitve osembitne zveze
z ukazom toggle binary
:
~> telnet
telnet> toggle binary
Negotiating binary mode with remote host.
telnet> open racunalnik
Telnet omogoca tudi, da si nastavitve za izbrane racunalnike
vnesemo v nastavitveno datoteko, ~/.telnetrc
.
Vnosi imajo obliko:
...
biofiz.mf.uni-lj.si
set binary true
...
Privzet nacin zveze pri programu ``rlogin'' je osembiten, eksplicitno pa lahko to dolocimo z dolocilom ``-8'':
rlogin racunalnik -8
Poslovenjenje paketa LaTeX obsega
Podporo za neangleske jezike v LaTeXu je poenotil paket
babel
Johannesa Braamsa z Nizozemske,
ki je standardni del vseh sodobnih distribucij paketa TeX na Linuxu,
kot sta teTeX in NTeX:
ftp://sunsite.informatik.rwth-aachen.de/pub/comp/tex/teTeX/
http://www.mathematik.uni-stuttgart.de/mathB/lst3/langbein/ntex.html
Z uporabo izbire ``slovene'' v paketu babel
se
avtomaticno izberejo slovenska imena pod- in nadnapisov, naslovov
ipd., slovenska pravila za zlogovanje besed (ce imamo namescene
slovenske zlogovalne vzorce), in
7-bitni nacin vnosa znakov "c"s"z
:
\usepackage[slovene]{babel}
V novi razlicici LaTeXa (LaTeX2e) lahko s paketoma
fontenc
in inputenc
izberemo tudi 8-bitno kodno
tabelo T1
(znano tudi kot DC ali Cork) in 8-bitni vnos
znakov. Primer celotnega spisa v LaTeXu:
\documentclass[a4paper]{article}
\usepackage[slovene]{babel}
\usepackage[T1]{fontenc}
\usepackage[latin2]{inputenc}
\begin{document}
Ceprav se pouk na zeleznicarski soli v Sentvidu obicajno konca
sele ob stirih, odidejo ucenci iz vasi Zelimlje in Zetale domov
ze cetrt cez tri.
\end{document}
V starejsi razlicici paketa LaTeX, LaTeX 2.09, ne moremo
uporabiti mehanizma inputenc
. Pomagamo si s stilom
latin2.sty
Andreja Brodnika. Primer uporabe:
\documentstyle[latin2]{article}
...
Stil latin2
je na voljo na vseh streznikih CTAN, npr.
ftp://ftp.dante.de/tex-archive/macros/latex209/contrib/latin2/
Datoteko s slovenskimi pravili za zlogovanje besed lahko dobijo
clani slovenskega drustva uporabnikov TeX (TeXCeH) za
individualno uporabo brez namena pridobivanja premozenjske
koristi pri predsedniku drustva, dr. Bojanu Golliju
<bojan.golli@ijs.si>
.
V Evropi je standardni format papirja A4, kar moramo dopovedati tudi programom za pregled besedila na zaslonu:
V datoteko ~/.Xresources
(osebna nastavitev)
dodamo vrstico
XDvi.paper: a4
V datoteko ~/.Xresources
(osebna nastavitev) ali
pa v datoteko /usr/lib/X11/app-defaults/Ghostview
(skupna
nastavitev) dodamo vrstice:
! Ghostview naj uporablja format A4
*pageMedia: A4
! Tudi Ghostscript naj uporablja format A4
*Ghostview.interpreter: gs
*Ghostview.arguments: -sPAPERSIZE=a4
Razen ISO Latin 2 vsebuje vse nase znake se nekaj drugih naborov: Microsoft Codepage 1250, IBM Codepage 852, JUS I.B1.002, Apple MacOS-CE, Apple MacOS-Croatian, Kamenicky itd.
Ceprav ni tezko napisati programcka za pretvorbo iz enega kodnega nabora v drugega, je pripravno uporabiti ze izdelan program. Eden takih je GNU recode, dostopen npr. na strezniku ARNES:
ftp://ftp.arnes.si/software/gnu/recode-3.4.tar.gz
Uporaba je enostavna:
recode yu:latin2 datoteka
pretvori datoteko iz kodnega nabora JUS I.B1.002 v kodni nabor
ISO Latin 2. Kot obicajno izda tudi tu izbira --help
se dodatne moznosti.
Less (avtor Mark Nudelman) je program za pregledovanje besedil
na zaslonu, in je priljubljena zamenjava standardnega more
.
Less prilagodimo za izpis osembitnih znakov z nastavitvijo v
~/.profile
:
LESSCHARSET=latin1; export LESSCHARSET
latin1
namesto latin2
ni pomota. Less zaenkrat
slednjega se ne pozna, ker pa ga pravzaprav zanima samo, kateri
znaki so obicajni, kateri pa kontrolni (ki zahtevajo posebno
obravnavo), ker pa je razpored znakov enak v celotni druzini ISO
8859, lahko izberemo kar latin1. Namesto tega lahko tudi
eksplicitno navedemo zaporedje tipa znakov v naboru:
LESSCHARDEF="8bcccbcc18b95.33b."; export LESSCHARDEF
Vsi nabori iz druzine ISO 8859 imajo osem binarnih znakov
(posebnih znakov, ki jih praviloma ni v besedilih), tri kontrolne
znake, binarni znak, dva kontrolna znaka, osemnajst binarnih
znakov, 95 navadnih znakov, 33 binarnih znakov, in normalne znake
do konca tabele.