Computerele, bineinteles, nu sunt atat de destepte; ele au nevoie sa li se spuna exact despre un lucru, cum este acesta descris si cum sa interactioneze cu el. Extensible Markup Language (XML) este un nou limbaj gandit sa faca chiar acest lucru: informatia sa se autodescrie. De cand a fost terminat XML, la inceputul lui 1988, standardul s-a raspandit ca focul, in industrie si stiinta. XML a fost dezvoltat de Worl Wide Web Consortium cunoscut si ca WBC.
Raspunsul entuziast a fost alimentat si de speranta ca XML va rezolva cateva din cele mai mari probleme ale Web-ului. Cele mai notorii sunt: Internetul este o retea ce se raspandeste cu viteza luminii, dar se misca precum un melc; chiar daca aproape orice fel de informatie este pusa la dispozitie on-line, este extrem de greu sa gasesti piesa care iti trebuie.
Ambele probleme isi gasesc originea in mare parte in natura celui mai important limbaj Web-HTML (Hypertext Markup Language). Chiar daca HTML este cel mai raspandit si utilizat limbaj de editare electronica inventat vreodata, el este superficial: in esenta descrie cum un browser de Web trebuie sa aranjeze textul, imaginile si butoanele din pagina. HTML este usor de invatat, dar aceasta invatare are pretul ei.
O data, ca este greu de creat un Web site care sa treaca de statutul de masina de fax ce transmite documente oricui le cere. Oamenii si companiile doresc site-uri care sa preia comenzi de la clienti, sa transmita retete medicale si chiar sa puna in functiune fabrici sau instrumente stiintifice. HTML nu este construit pentru asa ceva.
De exemplu, chiar daca un doctor este capabil sa extraga de pe pagina de Web informatiile pe care i le-ati trimis in legatura cu alergia dumneavoastra, el nu poate sa le trimita direct prin e-mail unui specialist si sa se astepte ca acesta sa le introduca direct in baza de date a unui spital. Computerul specialistului nu va sti ce sa faca cu informatia pe care o primeste sub forma:
informatie
Esperando
pentru Internet
Aceasta duce la linistea din librariile on-line sau alte site-uri interactive. Schimba cantitatea sau metoda de livrare si vei vedea o serie de numere ce se schimba in total, nu inainte ca informatiile sa plece pana intr-un server supertixit, care va trimite inapoi o pagina intreaga, fiind nevoie sa suportati o noua incarcare cu text si imagini.
Solutia: folosirea tag-urilor care sa spuna ce este informatia, nu ceea ce pare a fi. De exemplu, puncteaza partile dintr-o comanda pentru un tricou nu ca paragraf, linie sau casuta – ceea ce face HTML -, ci ca pret, cantitate, marime si culoare. Un program ar putea recunoaste toate acestea ca un ordin de la un client si va face ceea ce trebuie facut: va afisa tricoul intr-un fel sau altul, il va introduce intr-o baza de date sau va face toate demersurile necesare pentru ca a doua zi dimineata tricoul sa fie livrat.
La fel cum HTML a creat posibilitatea ca fiecare utilizator sa citeasca documente Internet, XML darama turnul Babel al incompatibilitatii sistemelor computerizate, dand nastere unui esperando in care toti pot sa scrie si sa citeasca. Spre deosebire de alte formate pentru computer, XML are un sens pentru utilizatori, deoarece nu este alcatuit decat din text.
Unificarea puterilor XML deriva din cateva reguli bine alese. Una dintre ele este aceea ca tag-urile vin aproape intotdeauna in perechi. La fel ca parantezele, ele inconjoara textul caruia ii vor fi aplicate, si la fel ca adnotarile, perechile de tag-uri se pot cuibari unele in altele pe multiple niveluri.
Regula cuibaririi forteaza automat simplitatea in fiecare document XML ce va lua forma unei structuri cunoscute de foarte mult timp in lumea computerelor: structura arborescenta. Asemenea unui arbore genealogic, fiecare grafic si bit de text din document reprezinta un parinte, copil sau orice alta ruda, eliminandu-se ambiguitatea. Structura arborescenta este foarte iubita de programatori.
O alta sursa a puterii de unificare a XML este Unicode, un sistem de codare-caracter ce poate organiza text in mai multe limbi. In HTML – ca de altfel in orice alt procesor de text – un document este scris intr-o anumita limba, fie ca este engleza, japoneza sau araba. Daca softul nu poate citi caracterele limbii respective, nu poti folosi documentul. Poate fi si mai rau: softuri facute in Taiwan nu pot citi texte chinezesti, din cauza incompatibilitatii codarii. In contrapartida, softuri ce citesc XML se pot descurca cu orice combinatie de caractere. XML permite schimbul de informatii nu numai intre computere, ci si intre natiuni si culturi diferite.
Pe masura ce XML se imprastie, Web-ul ar trebui sa fie din ce in ce mai receptiv. In prezent, toate sculele conectate la Web, fie ele calculatoare superperformante sau calculatoare de buzunar, nu pot decat sa primeasca un formular, sa-l completeze si sa-l trimita inapoi cu ajutorul unui server Web, pana cand treaba este completa. Dar informatiile structurale si semantice ce pot fi adaugate cu ajutorul XML permit calculatoarelor sa faca o treaba mai buna in procesare. Acest fapt duce la o scadere dramatica a traficului.
XML elimina erorile
predecesorilor
Pentru a intelege de ce, imaginati-va ca intrebati, la o agentie de turism de pe Internet, despre toate zborurile dintre Londra si New York intr-o zi oarecare. Veti primi, probabil, peste un timp, o lista care depaseste dimensiunile monitorului. Se poate scurta lista prin ajustarea preturilor, indicarea liniei aeriene preferate, dar pentru aceasta trebuie trimisa o depesa pe Internet, inapoi la firma de turism, dupa care urmeaza asteptarea raspunsului.
Daca insa lista zborurilor a fost trimisa in format XML, atunci agentia poate trimite un program scris in Java, ce va contine toate datele referitoare la zboruri, program ce le va sorta in functie de cerintele dvs., intr-o perioada de timp foarte scurta si fara a mai implica dute-vino-ul prin servere. Multiplicati acest exemplu cu milioane de utilizatori si cu zeci de mii de situatii si veti constata ca traficul va scadea.
In momentul in care cauti informatii pe Internet solutia este de a te uita nu la informatia in sine, ci la seturi de date ce te pot ghida catre sursele utile. Informatiile despre informatii sunt cunoscute sub numele de metadate. O parte din eforturile pentru crearea XML a fost canalizata pentru realizarea unui standard printre metadate. RDF (Resource Description Framework) indeplineste pentru Web rolul unui catalog de carti pentru o librarie. Aruncate pe Internet, aceste RDF-uri reusesc o cautare mult mai fina si mai completa.
Exista, bineinteles si alte moduri in care pot fi gasite informatiile pe Internet. Web-ul este in final la picioarele hypertext-ului, prin intermediul miliardelor de hyperlink-uri existente. Hyperlink-urile vor avea o alta valoare in momentul in care vor fi folosite prin intermediul XML. A fost creat un standard si pentru acestea, denumit XLink, ce va permite alegerea destinatiilor dintr-o lista intreaga. Alte genuri de hyperlink-uri vor permite introducerea textului si imaginilor chiar acolo unde va aflati, in loc sa va forteze sa parasiti site-ul.
Probabil, cea mai folositoare caracteristica este aceea prin care XLink permite autorilor sa utilizeze link-uri indirecte, ce puncteaza intrarea intr-un fel de baze de date. Cand adresa unei pagini se schimba, autorul va fi in stare sa actualizeze toate link-urile ce duc la pagina lui, prin editarea unei singure inregistrari in baza de date. Aceasta ar trebui sa elimine celebrul mesaj: „404 file not found, ce atentioneaza asupra unei legaturi rupte.
Web-ul ajutat de XML va deveni mai rapid, mai prietenos si un loc mai bun pentru afaceri. Designerii de site-uri de Web il vor gasi mai atractiv. Batalioane intregi de programatori vor explora capacitatile XML. r
r