BaTelÒc : Basa Textuala per la lenga d'Òc
  Acuèlh ] [ Causida del còrpus ] [ Cèrca simpla ] [ Cèrca avançada ] [ Ajuda ] [ Projècte ] [ Contacte ]   Licence Creative Commons - Certains droits réservés

Pagina d'ajuda

Acuèlh

La pagina d'acuèlh prepausa de descobrir BaTelòc e porgís per aquò far un còrpus de descobèrta amb una interfàcia de cèrca simpla.
Lo còrpus de descobèrta es un còrpus predefinit de tèxtes de bon legir pels començaires.
Un còp la descobèrta facha, vos poiretz bastir vòstre corpus de trabalh, siá en clicant sus Se causir un còrpus de trabalh, siá en cliquant sus Causida del còrpus dins la barra de naut.

Causida del còrpus

Trobaretz sus aquesta pagina dos biasses de vos bastir un còrpus de trabalh :
  1. podètz causir un còrpus predefinit demèst los tres corpora seguents :
    • lo còrpus de descobèrta (definit çai-sus) ;
    • lo còrpus de contes : un còrpus de contes literaris ;
    • lo còrpus Roergue : un còrpus d'òbras d'autors de Roergue (Molin, Bodon, Martí, Delèris, ...)
  2. podètz seleccionar un o mantunes tèxtes de la basa mercés a una cèrca « multi-critèris ». Fa pas mestièr d'emplenar totes los critèris, basta de donar los que son pertinents per vòstra seleccion. Per defaut, totes los tèxtes seran seleccionats quand clicaretz sur validar. Los critèris son :
    • Titol conten : seleccionar los tèxtes a partir d'un (ou de mai d'un) mot(s) del títol del tèxte de l'òbra. Vos cal far plan atencion de respectar menimosament la forma dels mots (majusculas/minusculas).
    • Annada de naissença de l'autor :seleccionar los tèxtes segon l'annada de naissença de l'autor, es a dire causir de tèxtes que los autors son nascuts a una data donada, o abans o après una data : = (egal), < (abans), > (après)
    • Annada de creacion : seleccionar los tèxtes de las òbras creadas a una data donada, o abans o après una data : = (egal), < (abans), > (après).
      NB : la data de creacion d'una òbra pòt èsser anteriora a la data de la primièra edicion.
    • Annada d'edicion : seleccionar los tèxtes de las òbras editadas a una data donada, o abans o après una data : = (egal), < (abans), > (après).
      NB : la data d'edicion pòt èsser posteriora a l'annada de creacion de l'òbra mai que mai s'es una reedicion.
    • Autors : seleccionar los tèxtes d'un (o de mai d'un) autor
    • Dialèctes : seleccionar los tèxtes d'un (o de mai d'un) dialècte
    • Genre : seleccionar los tèxtes d'un (o de mai d'un) genre
    • Grafias : seleccionar los tèxtes d'una (o de mai d'una) grafia

    Se causissètz *, seleccionaretz totas las possibilitats prepausadas : per exemple totes los autors, totes los dialèctes, etc. Se daissatz * dins los 4 camps de causida (Autors, Dialèctes, Genres, Grafias), seleccionaretz totes los tèxtes de la basa. Per seleccionar mai d'un item, sens los seleccionar totes, basta de far Ctrl+clic.


Çai-jos, un exemple de seleccion d'un corpus de tèxtes en lengadocian e en grafia classica que los autors son nascuts après 1945.
Clicatz sus e veiretz la tièra dels tèxtes seleccionats :

Podètz tirar de tèxtes que vos convenon pas (en deselectionnant), per exemple « Las trèvas d'Orador » qu'es una revirada, e actualizar lo còrpus en clicant sus

Un còp que lo còrpus es bastit, es a dire que los tèxtes son seleccionats, podètz començar las cèrcas :
Se trobatz pas los tèxtes que vos cal, nos podètz ajudar a completar la basa, en particulièr pels dialèctes, genres o grafias que son pas encara representats, en nos mandant de tèxtes, o en nos signalant un tèxte qu'aimariatz i trobar (contact).

Cèrca

Las cèrcas de contèxtes dins BaTelÒc se fan sus de tèxtes indexats. Indexar la basa vòl dire ne bastir un index, es a dire una tièra de totes los mots que se tròban dins los tèxtes amb la localisacion exacta de cada ocurréncia. Permet un accès plan mai rapide als contenguts dels tèxtes de la basa. L'unitat de cèrca dins BaTelÒc es doncas lo mot grafic, que se ditz tanben forma (atencion d'unas formas coma pr'amor, d'acòrdi, pr'aquò... son consideradas coma una sola unitat). NB : es possible de cercar de seguidas de mots grafics (veire Cèrca avançada).

Cèrca simpla

La cèrca simpla vos permet de cercar un mot (o forma).
La cèrca es dicha sensible a la caissa, es a dire que cal respèctar estrictament las minisculas e las majusculas.

Cèrca avançada

La cèrca avançada permet de :
  1. cercar de partidas de mot/forma
  2. utilizar las expressions regularas
  3. cercar mai d'un mot/forma (en seguida ou pas)
Permet tanben d'aver un contèxte mai larg.

Cercar de partidas de mot

Se pòt cercar una forma que « es », « conten », « comença per » o « s'acaba per » una seguida de caractèrs.
Per exemple, per cercar las formas que s'acaban per (« s'acaba per ») « òta » :

Utilizar las expressions regularas

Per utilizar las expressions regularas, cal causir la fonccion « REGEXP » al luòc de « es », « conten », « comença per » o « s'acaba per ».
Una expression regulara es una seguida o cadena de caractèrs que descriu un ensemble de cadenas de caractèrs possiblas. L'expression deu respectar una sintaxa precisa.
Las expressions regularas son compausadas de caractèrs joquèrs : Amb una expression regulara, se pòt tanben prepausar de causir entre dos caractèrs (operator « o » de disjonction). Per notar una disjonccion, cal metre los caractèrs entre cròcs [XY] o metre los caractèrs desseparats per de barras verticalas entre parentèsis (X|Y) :

Cercar mai d'un mot

Se pòt cercar mai d'un mot o forma (fins a 5). Per apondre una forma de mai a cercar, clicatz sus . Per cada mot/forma, podètz utilizar las fonccions « es », « conten », « comença per » o « s'acaba per », o « REGEXP ».
Se pòt reglar la pagèla de l'interval entre 2 formas : Exemples :
Per cercar una seguida de mots que se costejan coma « dins pauc de temps » :

Per cercar los dos mots « tant » e « coma » amb un mot entremièg (es a dire cercar la forme « coma » dins un interval de dos mots après la forma « tant »):

Ne saber mai

Dins la Cèrca simpla tant plan coma dins la Cèrca avançada : Se per cas, volètz far una cèrca (simpla o avançada) sens aver bastit un còrpus abans auretz lo messatge d'error Vos cal causir un còrpus, que i poiretz clicar dessús per anar a la pagina Causida del còrpus.

Mai d'exemples de cèrcas

- Cercar los contèxtes de "qu'es aquò" :


- Cercar d'ocurréncias de "costat" dins una fenèstra de 9 mots après d'ocurréncias de "autre" :

- Cercar de mots que s'acaban per "et" o "ets" o "eta" o "etas" (per cercar, en una sola cèrca, de derivats en –et o –eta quina que siá la flexion)

- Autre biais de far la meteissa cèrca