13. prosince 2007

Apache Forrest - děkuji, nechci

V poslední době jsem musel malinko oželet programování vlastních aplikací, protože jsem více řešil nasazení a konfiguraci produktů třetích stran. Jedním z nich byl produkt se jménem Apache Forrest.

K čemu je Apache Forrest dobrý? Je dobrý k tomu, když si potřebuji vytvořit webovou prezentaci (a nechci ji vytvářet sám přímo pomocí HTML), když chci mít na webu automaticky řadu zajímavých funkcí jako fulltextové vyhledávání, tisk, export do PDF a hlavně, když mám již spoustu dokumentů (různé obrázky, HTML, PDF atd.), které bych rád znovu využil. Pokud chci vytvářet obsah webu sám, pak mám možnost použít celkem intuitivní pseudo-HTML jazyk. Úvodem je ještě vhodné uvést, že například většina projektů Apache má web vytvořený právě pomocí tohoto nástroje.

Podle toho, co jsem doposud napsal by se mohlo zdát, že je to super mocný nástroj. Bohužel jsem si to na začátku taky myslel, ale teď už moc ne. Ale postupně...

Formáty dokumentů

Apache Forrest umí pracovat na vstupu s různými formáty dokumentů a to díky rozšířením Apache Forrest (tzn. pluginy). Základní konfigurace umožňuje na vstupu použít následující formáty dokumentů (kromě dokumentů zapsaných přímo ve formátu Apache Forrest XML):
  • XML

  • HTML

  • MS Excel (tabulka z MS Excel musí být uložena jako Tabulka XML)

  • OpenOffice (Impress, Writer) verze 1 (přípona .sxw)

U těchto vstupních formátů se dokumenty přímo upraví do jednotného vzhledu a struktury webu. Samozřejmě je možné formou odkazu přímo na dokument připojit dokument v libovolném formátu – ten pak sice nebude zpracován a převeden do HTML, ale bude možné jej stáhnout.
Bohužel není možné přímo integrovat nejrozšířenější dokumenty MS Word. Jde to ale obejít přes OpenOffice – dokument z MS Word načtu v OpenOffice a uložím ve formátu OpenOffice (sxw).

Apache Forrest jsem intenzivně používal přes dva týdny a na základě této zkušenosti mohu uvést následující výhody a nevýhody:

Výhody

  • Vzhled webu lze kompletně upravit pomocí CSS (viz projekty Apache).

  • Velké množství vlastností výsledného webu je možné upravit pouze pomocí konfigurace

  • Žádný srovnatelný nástroj (se stejným zaměřením) se mi nepodařilo najít.

Nevýhody

  • Apache Forrest si moc nerozumí s češtinou - měl jsem problémy s českou diakritikou při exportu do PDF nebo při importu dokumentů z OpenOffice.

  • Nepodařilo se mi vůbec rozchodit fulltextové vyhledávání s Lucene. Varianta s Google fungovala dobře.

  • Apache Forrest je v současné verzi 0.8 a moc to nenasvědčuje tomu, že by se v brzké době objevila nějaká stabilní verze 1.0. Když jsme tento nástroj vybírali do jedné nabídky na konci roku 2006, tak byla verze 0.7.

  • Z uživatelského hlediska se nejedná o zrovna přívětivý nástroj. Vše je ovládané pouze z příkazové řádky.


Po všech uvedených nevýhodách jsme byli nuceni přejít na jiné řešení se jménem Daisy. Sice je to řešení z kategorie CMS a tedy směřované trochu jiným směrem než Apache Forrest, nicméně základ je opět postavený nad nástrojem Apache Cocoon a tedy z hlediska možností práce s dokumenty velice podobné. Všechny nevýhody Apache Forrest jsou v Daisy vyřešeny a řada výhod zůstala.

2 komentáře:

Anonymní řekl(a)...

Ahoj,
mimo jine i openoffice ma u nekterych fontu problemy s prevodem cestiny do pdf. Jestli to nebude prave tim. A to i pri prikladani fontu do vysledneho pdf. Po zmene se mi vzdy nakonec cestina vyexportovala v poradku.

Dale pak ne kazdy prohlizec pdf, obzvlaste ty starsi, si s fonty poradi.

Pet

Anonymní řekl(a)...

Jiri Kosek mal na stranke pred vekmi navod, ako vyriesit problem s diakritikou v PDF.

Ale to nic nemeni na tom, ze Forrest je zrejme odsudeny na dlhu agoniu a potom smrt. Nova verzia prichadza radovo raz za 2 roky a nevyzera to, zeby sa problemy mienili riesit. Kedysi som v tom robil propagacnu stranku pre svoju diplomku, ale teraz mi cely postup prace s Forrestom pride ,,ponekud" tazkopadny a nepohodlny.