La pagina d'acuèlh prepausa de descobrir BaTelòc e porgís per aquò far un còrpus de descobèrta amb una interfàcia de cèrca simpla. Lo còrpus de descobèrta es un còrpus predefinit de tèxtes de bon legir pels començaires.
Un còp la descobèrta facha, vos poiretz bastir vòstre corpus de trabalh, siá en clicant
sus Se causir un còrpus de trabalh,
siá en cliquant sus Causida del còrpus dins la barra de naut.
Causida del còrpus
Trobaretz sus aquesta pagina dos biasses de vos bastir un còrpus de trabalh :
podètz causir un còrpus predefinit demèst los tres corpora seguents :
lo còrpus de descobèrta (definit çai-sus) ;
lo còrpus de contes : un còrpus de contes literaris ;
lo còrpus Roergue : un còrpus d'òbras d'autors de Roergue (Molin, Bodon, Martí, Delèris, ...)
podètz seleccionar un o mantunes tèxtes de la basa mercés a una cèrca « multi-critèris ». Fa pas mestièr d'emplenar totes los critèris, basta de donar los que son pertinents per vòstra seleccion. Per defaut, totes los tèxtes seran seleccionats quand clicaretz sur validar. Los critèris son :
Titol conten : seleccionar los tèxtes a partir d'un (ou de mai d'un) mot(s) del títol del tèxte de l'òbra. Vos cal far plan atencion de respectar menimosament la forma dels mots (majusculas/minusculas).
Annada de naissença de l'autor :seleccionar los tèxtes segon l'annada de naissença de l'autor, es a dire causir de tèxtes que los autors son nascuts a una data donada, o abans o après una data : = (egal), < (abans), > (après)
Annada de creacion : seleccionar los tèxtes de las òbras creadas a una data donada, o abans o après una data : = (egal), < (abans), > (après).
NB : la data de creacion d'una òbra pòt èsser anteriora a la data de la primièra edicion.
Annada d'edicion : seleccionar los tèxtes de las òbras editadas a una data donada, o abans o après una data : = (egal), < (abans), > (après).
NB : la data d'edicion pòt èsser posteriora a l'annada de creacion de l'òbra mai que mai s'es una reedicion.
Autors : seleccionar los tèxtes d'un (o de mai d'un) autor
Dialèctes : seleccionar los tèxtes d'un (o de mai d'un) dialècte
Genre : seleccionar los tèxtes d'un (o de mai d'un) genre
Grafias : seleccionar los tèxtes d'una (o de mai d'una) grafia
Se causissètz *, seleccionaretz totas las possibilitats prepausadas : per exemple totes los autors, totes los dialèctes, etc. Se daissatz * dins los 4 camps de causida (Autors, Dialèctes, Genres, Grafias), seleccionaretz totes los tèxtes de la basa.
Per seleccionar mai d'un item, sens los seleccionar totes, basta de far Ctrl+clic.
Çai-jos, un exemple de seleccion d'un corpus de tèxtes en lengadocian e en grafia classica que los autors son nascuts après 1945.
Clicatz sus e veiretz la tièra dels tèxtes seleccionats :
Podètz tirar de tèxtes que vos convenon pas (en deselectionnant), per exemple « Las trèvas d'Orador » qu'es una revirada, e actualizar lo còrpus
en clicant sus
Un còp que lo còrpus es bastit, es a dire que los tèxtes son seleccionats, podètz començar las cèrcas :
Se trobatz pas los tèxtes que vos cal, nos podètz ajudar a completar la basa, en particulièr pels dialèctes, genres o grafias que son pas encara representats, en nos mandant de tèxtes, o en nos signalant un tèxte qu'aimariatz i trobar (contact).
Cèrca
Las cèrcas de contèxtes dins BaTelÒc se fan sus de tèxtes indexats. Indexar la basa vòl dire ne bastir un index, es a dire una tièra de totes los mots que se tròban dins los tèxtes amb la localisacion exacta de cada ocurréncia. Permet un accès plan mai rapide als contenguts dels tèxtes de la basa. L'unitat de cèrca dins BaTelÒc es doncas lo mot grafic, que se ditz tanben forma (atencion d'unas formas coma pr'amor, d'acòrdi, pr'aquò... son consideradas coma una sola unitat).
NB : es possible de cercar de seguidas de mots grafics (veire Cèrca avançada).
Cèrca simpla
La cèrca simpla vos permet de cercar un mot (o forma). La cèrca es dicha sensible a la caissa, es a dire que cal respèctar estrictament las minisculas e las majusculas.
Se pòt cercar una forma que « es », « conten », « comença per » o « s'acaba per » una seguida de caractèrs.
Per exemple, per cercar las formas que s'acaban per (« s'acaba per ») « òta » :
Utilizar las expressions regularas
Per utilizar las expressions regularas, cal causir la fonccion « REGEXP » al luòc de « es », « conten », « comença per » o « s'acaba per ».
Una expression regulara es una seguida o cadena de caractèrs que descriu un ensemble de cadenas de caractèrs possiblas. L'expression deu respectar una sintaxa precisa.
Las expressions regularas son compausadas de caractèrs joquèrs :
^ : començança de forma
$ : fin de forma
. : quin caractèr que siá
* : 0, 1 o mai d'un còp la cadena qu'es abans
+ : 1 o mai d'un còp la cadena qu'es abans
? : 0 o 1 còp la cadena qu'es abans
Amb una expression regulara, se pòt tanben prepausar de causir entre dos caractèrs (operator « o » de disjonction). Per notar una disjonccion, cal metre los caractèrs entre cròcs [XY] o metre los caractèrs desseparats per de barras verticalas entre parentèsis (X|Y) :
[iau]t$ : cèrca un mot que s'acaba per una de las vocalas i, a, u seguida d'una t
^[aA]mor$ : cèrca « amor » e « Amor » (amb una a minuscula o una A majuscula)
((colc)|(levat))$ : cèrca siá « colc », siá « levat » en fin de mot
^des.*[aei]r$ : cèrca un mot que comença per « des » e s'acaba per « ar » o « ir » o « er »
Cercar mai d'un mot
Se pòt cercar mai d'un mot o forma (fins a 5). Per apondre una forma de mai a cercar,
clicatz sus . Per cada mot/forma, podètz utilizar las fonccions « es », « conten », « comença per » o « s'acaba per », o « REGEXP ».
Se pòt reglar la pagèla de l'interval entre 2 formas :
se volètz cercar de formas que se seguisson, la cal daissar a 1,
se volètz cercar de formas que son pas a costat dins lo tèxte, podètz causir la distancia que los dessepara en nombre de mots : la segonda forma cercada se pòt trobar dins una fenèstra de 2 a 9 mots après la primièra forma cercada.
Exemples :
Per cercar una seguida de mots que se costejan coma « dins pauc de temps » :
Per cercar los dos mots « tant » e « coma » amb un mot entremièg (es a dire cercar la forme « coma » dins un interval de dos mots après la forma « tant »):
Ne saber mai
Dins la Cèrca simpla tant plan coma dins la Cèrca avançada :
se pòt veire un contèxte mai larg en clicant sus lo tèxte. Aquel contèxte larg permet de veire las segmentacions en paragrafs que se veson pas dins las citacions (o concordanças).
se pòt veire las metadonadas associadas a l'òbra que la concordança n'es tirada en clicant sus [nom de l'autor/títol de l'òbra] a esquèrra de la concordança.
Se per cas, volètz far una cèrca (simpla o avançada) sens aver bastit un còrpus abans auretz lo messatge d'error
Vos cal causir un còrpus, que i poiretz clicar dessús per anar a la pagina Causida del còrpus.
Mai d'exemples de cèrcas
- Cercar los contèxtes de "qu'es aquò" :
- Cercar d'ocurréncias de "costat" dins una fenèstra de 9 mots après d'ocurréncias de "autre" :
- Cercar de mots que s'acaban per "et" o "ets" o "eta" o "etas" (per cercar, en una sola cèrca, de derivats en et o eta quina que siá la flexion)