Publications


    Per-fide Project: presentation

  • José João Almeida, Sílvia Araújo, Alberto Simões, Idalete Dias. 2014. The Per-Fide corpus: A new resource for corpus-based terminology, contrastive linguistics and translation studies. In Tony Berber Sardinha and Telma de Lurdes São Bento Ferreira, editors, Working with Portuguese Corpora. Bloomsbury Publishing, 177–200.
  • José João Almeida, Sílvia Araújo, Idalete Dias, Ana Correia. 2013. Per-Fide: Projeto de compilação de um corpus multilingue. Humanidades. In Macedo, Ana Gabriela, Carlos Mendes de Sousa, Vítor Moura (eds.) XIV Colóquio de Outono - Humanidades: Novos Paradigmas do Conhecimento e da Investigação . Braga: CEHUM/Húmus, 323-342.
  • Sílvia Araújo, José João Almeida, Alberto Simões & Idalete Dias. 2010. Apresentação do projecto Per-Fide: Paralelizando o português com seis outras línguas. Linguamática, 2(2): 71-74.

  • Parallel Corpora

  • José João Almeida & Pedro Carvalho. 2014. MLTaligner -- a tool for multilingual text alignment. LREC.
  • José João Almeida, Alberto Simões. 2010. Automatic parallel corpora and bilingual terminology extraction from parallel websites. In Reinhard Rapp,Pierre Zweigenbaum, Serge Sharoff, editors, BUCC2010 – 3rd Workshop on Building and Using Comparable Corpora, lrec2010, Valletta, Malta, May 2010. 50–55.

  • Probabilistic Translation Dictionaries

  • Alberto Simões, José João Almeida, Nuno Ramos Carvalho. 2013. Defining a probabilistic translation dictionaries algebra. In Em Luís Correia, Luís Paulo Reis, José Cascalho, Luís Gomes, Hélia Guerra, e Pedro Cardoso, editores, XVI Portuguese Conference on Artificial Inteligence - EPIA, Angra do Heroismo, Azores, 444–455.
  • Nuno Ramos Carvalho, José João Almeida, Maria João Varanda Pereira, Pedro Rangel Henriques. 2012. Probabilistic synset based concept location. In SLATe'12 — Symposium on Languages, Applications and Technologies OASIC– volume 21 of Open Access Series in Informatics, Schloss Dagstuhl - Leibniz-Zentrum für Informatik, Dagstuhl Publishing, Germany. 239–253.

  • Corpora

  • Brett Drury, José João Almeida. 2012. The minho quotation resource. In Nicoletta Calzolari et al., editors,Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), Istanbul, Turkey, May 2012. European Language Resources Association (ELRA).

  • Per-Fide BookCleaner

  • André Santos, José João Almeida & Nuno Carvalho. 2012. Structural alignment of plain text books. In Nicoletta Calzolari et al., editors. In Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), Istanbul, Turkey. European Language Resources Association (ELRA).
  • André Santos & José João Almeida. 2011. Text::Perfide::BookCleaner, a perl module to clean and normalize plain text books. In Actas del XXVII Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural.

  • Per-Fide BookCleaner, Workflow, Alignment

  • Pedro Carvalho, José João Almeida. 2014. MLT-prealigner: a Tool for Multilingual Text Alignment. In Maria Joao Varanda Pereira and Jose Paulo Leal and Alberto Simoes (éds.) 3rd Symposium on Languages, Applications and Technologies. Volume 38 of OpenAccess Series in Informatics (OASIcs). Dagstuhl, Germany: Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik. 283—290.
  • Rui Brito, José João Almeida. 2014. A Workflow Description Language to Orchestrate Multi-Lingual Resources, Maria Joao Varanda Pereira and Jose Paulo Leal and Alberto Simoes (éds.) 3rd Symposium on Languages, Applications and Technologies. volume 38 of OpenAccess Series in Informatics (OASIcs) , Dagstuhl, Germany: Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik. 77—83.
  • André Fernandes dos Santos. 2011. Contributions for building a Corpora-Flow system. Tese de Mestrado em Engenharia Informática, Braga: Universidade do Minho.

  • Entities mentioned

  • Simões, Alberto, José João Almeida, Simon D. Byers. 2014. Language Identification: a Neural Network Approach. Em Maria João Varanda Pereira, José Paulo Leal, Alberto Simões, editores, 3rd Symposium on Languages, Applications and Technologies, volume 38 of OpenAccess Series in Informatics (OASIcs), Dagstuhl, Germany. Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik, 251--265.
  • José João Almeida, Brett Drury. 2010. Identification, extraction and population of collective named entities from business news. In Entity2010 – Workshop on Resources and Evaluation for Entity Resolution and Entity Management, lrec2010, Valletta, Malta, May 2010, 19–22.

  • Orthographic agreement

  • José João Almeida, André Santos & Alberto Simões. Bigorna – a toolkit for orthography migration challenges. In Nicoletta Calzolari et al., editors, Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10) , Valletta, Malta, May 2010. European Language Resources Association (ELRA).

  • XML

  • Alberto Simões & Sara Fernandes. 2011. XML schemas for parallel corpora. In Alberto Simões, editor, XATA 2011 --- 9ª Conferência Nacional em XML, Aplicações e Tecnologias Associadas, Vila do Conde, Portugal. 59—69.
  • Alberto Simões. 2010. Test::XML::Generator --- generating XML for unit testing. In Alberto Simões, Daniela da Cruz, e José Carlos Ramalho, editores, XATA 2010 --- 8ª Conferência Nacional em XML, Aplicações e Tecnologias Associadas, Vila do Conde, 39—44.

  • PTD, Triangulation, Terminology

  • Alberto Simões, José João Almeida, Nuno Ramos Carvalho. 2013. Defining a probabilistic translation dictionaries algebra. Em Luís Correia, Luís Paulo Reis, José Cascalho, Luís Gomes, Hélia Guerra, e Pedro Cardoso, editores, XVI Portuguese Conference on Artificial Inteligence - EPIA, Angra do Heroismo, Azores, September, 444—455.
  • Alberto Simões, Xavier Gómez Guinovart. 2010. Translation dictionaries triangulation. In Carmen Mateo, Francisco Díaz, Francisco Pazó, editores, FALA2010 -- II Iberian SLTech Workshop, Vigo. 171—174.

  • TMX, TMXa, TMXpl, PTD, Tagger

  • Rui Brito, José João Almeida & Alberto Simões. Per-fide -- annotated parallel corpora. LREC 2014.

  • Corpora for teaching purposes

  • Alberto Simões & Diana Santos. 2011. Ensinador: corpus-based Portuguese grammar exercises. Procesamiento del Lenguaje Natural , 47: 303--311.

  • FreeLing

  • Alberto Simões & Nuno Carvalho. 2012. Desenvolvimento de aplicações em Perl com FreeLing 3. Linguamática, 4(2), 87-92.

  • Sites

  • Alberto Simões, Anália Lourenço & José João Almeida. 2013. Evaluating web site structure based on navigation profiles and site topology. In Álvaro Rocha, Ana Maria Correia, Tom Wilson, and Karl A. Stroetmann, editors, Advances in Information Systems and Technologies, volume 206 of Advances in Intelligent Systems and Computing, Springer Berlin Heidelberg, 305–311.

  • Dictionaries

  • Alberto Simões, Iriarte Álvaro, José João Almeida. 2014. Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora. In Alain Lemaréchal, Peter Koch, and Pierre Swiggers, editors, Actes du XXVIIe Congrès international de linguistique et de philologie romanes, Nancy, 15-20 july 2013. ALTIF. Section 16: Projets en cours; ressources et outils nouveaux.
  • Alberto Simões, Xavier Gómez Guinovart. 2013. Dictionary Alignment by Rewrite-based Entry Translation. In José Paulo Leal, Ricardo Rocha, e Alberto Simões, editores, 2nd Symposium on Languages, Applications and Technologies,volume 29 of OpenAccess Series in Informatics (OASIcs) , 237-247, Dagstuhl, Germany. Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik. li>
  • Alberto Simões, Álvaro Iriarte Sanromán, José João Almeida. 2012. Dicionário-aberto – a source of resources for the portuguese language processing. Computational Processing of the Portuguese Language, Lecture Notes for Artificial Intelligence, 243: 121-127.
  • Alberto Simões, Rita Farinha. 2011. Dicionário Aberto: um recurso para processamento de linguagem natural. Vice-Versa, 16: 159-171.

  • Corpus-based language studies

  • Sílvia Araújo, Ana Correia & William Martinez. 2013. Le corpus Per-Fide et ses applications: une étude de cas sur les expressions idiomatiques. In Buchi, Éva/Chauveau, Jean-Paul/Pierrel, Jean-Marie (éd.) Actes du XXVIIe Congrès international de linguistique et de philologie romanes (Nancy, 15-20 juillet 2013), 3 volumes. Strasbourg: Société de linguistique romane/ÉLiPhi. 15-20 de julho, Nancy.
  • Sílvia Araújo, Nadejda Machado. 2013. La traduction en portugais et russe des constructions françaises se faire Vinf: étude syntaxique, sémantique et pragmatique sur la base du corpus parallèle Per-Fide. In Irina Kor Chahine, C. Zaremba (org.) Travaux de slavistique: Actes du VIe congrès de la Slavic Linguistics Society. Presses Universitaires de Provence. Collection / Série: Langues et langage, 133-144.
  • Sílvia Araújo, Ana Correia, Cristina Real. 2013. Translating Pronominal Causative Constructions: se faire vs. hacerse/fazer-se + Inf. . Selected Papers from the 5th International Conference on Corpus Linguistics (CILC2013) Procedia - Social and Behavioral Sciences, Volume 95, 344–353.
  • Sílvia Araújo. 2013. Linguística de corpus e tradução da construção francesa se voir + INF/PP em português e em espanhol. Textos Selecionados do XXVIII Encontro Nacional da Associação Portuguesa de Linguística, 25 de Outubro de 2012, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve, 99-109.
  • Sílvia Araújo. 2012. Pour une caractérisation syntaxique et sémantico-pragmatique de la construction causative en faire/fazer inf en français et en portugais. Revue Studii de gramatica contrastiva (Études de grammaire contrastive) , nº 17/2012, Université de Pitesti, Roumanie, 7-28.
  • Sílvia Araújo, Natália Fumega. 2012. Apport de la linguistique de corpus aux études constructives. Le cas des constructions françaises en se voir Inf-PP / se faire Inf et leurs traductions en portugais. Estudos Linguísticos/Linguistic Studies nº8, Lisboa, Edições Colibri/CLUNL, 2012, pp. 41-58.
  • Sílvia Araújo, Otília Sousa. 2012. Pour une approche contrastive du présent simple en français et en portugais. In Franck Neveu, Valeria Muni Toke, Peter Blumenthal, Thomas Klingler, Pierluigi Ligas, Sophie Prévost et Sandra Teston-Bonnard (Eds.) 3e Congrès Mondial de Linguistique Française, vol.1, 1683-1699.
  • Paulo Freitas. 2012. Tradução e terminologia informática: para uma análise da criação neológica, Universidade do Minho. Dissertação desenvolvida no âmbito do Mestrado em Tradução e Comunicação Multilingue. Orientadores: Sílvia Araújo e Álvaro Iriarte, ILCH/UM.
  • Sílvia Araújo. Les opérateurs causatifs faire, donner, mettre à Inf en français et fazer, mandar Inf en portugais et la 'montée’ des arguments à la position de sujet syntaxique. In Dan Van Raemdonck et al. (ed.), Actes du colloque international «ComplémentationS». Bruxelles: Peter Lang, 2010.
  • Joana Veloso. 2013. Identificação/extração semiautomática de colocações utilizando métodos contrastivos. Tese de Mestrado. Orientadores: Álvaro Iriarte e Alberto Simões, Braga: Universidade do Minho.
  • Rudy Espinoza. 2012.Análisis de errores en traducciones de hablantes no nativos del español. Tese de Mestrado. Orientadores: Sílvia Araújo e Secundino Artos, Braga: Universidade do Minho.
  • Ana Rita Azevedo. 2012. Courrier Internacional: a tradução no mundo jornalístico. Tese de Mestrado. Orientador: Sílvia Araújo, Braga: Universidade do Minho.
  • Sílvia Araújo. 2010. Entre l’actif et le passif: se faire/fazer-se. Syntaxe, sémantique et pragmatique comparées français-portugais. Saarbrücken: Editions Universitaires Européennes.

Communications

    Per-Fide: Latest Developments


  • Rui Brito. Per-Fide: Latest Developments. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de Setembro de 2013.
  • Sílvia Araújo & Ana Correia. Projeto Per-Fide: da compilação de corpora à criação de recursos terminológicos. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.
  • Sílvia Araújo & Ana Oliveira. Per-Fide: balanço. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • Ana Oliveira, Ana Correia, Idalete Dias & Sílvia Araújo. Per-fide: Apresentação do projecto. I Workshop Per-fide. Construção, Exploração e Aplicação de Corpora Paralelos. Universidade do Minho, Braga, 16 17 de setembro de 2010.

  • Parallel Corpora

  • Jörg Tiedemann. The Amazing Utility of Parallel Corpora. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Jörg Tiedemann. Building parallel corpora. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Pedro Carvalho. Creating a technical corpus. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • José João Almeida & Alberto Simões. Criação e características de um corpus paralelo de resumos de teses. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.

  • Probabilistic Translation Dictionaries

  • Alberto Simões & José Almeida. Álgebra de Dicionários Probabilísticos de Tradução. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.

  • Corpora

  • Diana Santos [consultora]. Para que serve um corpo?. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Diana Santos [consultora]. Alguns métodos que podem ser usados com corpos. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Ana Correia, Ana Oliveira, Idalete Dias & Sílvia Araújo. How to Query Corpora. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Claudio Bendazzoli [consultor]. Building a spoken corpus: examples from Corpus-based Interpreting Studies. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Claudio Bendazzoli [consultor]. Transcription and annotation of spoken corpora. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Alberto Simões & José João Almeida. Introduction to Computational Terminology. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Idalete Dias. Terminologia e Lexicografia. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.
  • Xavier Gómez Guinovart & Alberto Simões. Expansão do Galnet: uma wordnet para o Galego. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.
  • Sílvia Araújo. Humanidades digitais: conceito, práticas e desafios. I Jornadas do ILCH. Universidade do Minho, Braga, 26-29 de abril de 2013.
  • Sílvia Araújo & Ana Correia. Ferramentas no mercado de trabalho. X Jornadas de Línguas Aplicadas. Universidade do Minho, Braga, 23 de abril de 2012.
  • Sílvia Araújo, Idalete Dias & Ana Oliveira. Como pesquisar em corpora. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.

  • Per-Fide BookCleaner, Workflow, Alignment

  • Alberto Simões, José João Almeida & André Santos. Ferramentas de Alinhamento na Web. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • André Santos. Preparação de livros para alinhamento. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • José João Almeida. Work-Flow Per-Fide. I Workshop Per-Fide. Construção, Exploração e Aplicação de Corpora Paralelos. Universidade do Minho, Braga, 16-17 de setembro de 2010.

  • TMX, TMXa, TMXpl, PTD, Tagger

  • Alberto Simões, Rui Brito & Luís Braga. Corpora Paralelos anotados: TMXA - TMX anotadas e seus derivados. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.

  • Corpora for teaching purposes

  • Sílvia Araújo. As concordâncias bilingues – um instrumento para a formação de tradutores a partir de dados de um corpus. XVII Encontro Internacional de Reflexão e Investigação (EIRI). UTAD, 16-17 de abril de 2013.

    Dictionaries

  • Nuno Carvalho, Rui Brito, Luís Miguel Braga, Alberto Simões & José João Almeida. Parallel Corpora-based Dictionaries and Their Applications. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • Alberto Simões & Álvaro Iriarte. Making the most of a 100-year-old dictionary. Summer School of Linguistics Per-Fide 2013. Corpus Linguistics and Natural Language Processing. Universidade do Minho, Braga, 9-12 de setembro de 2013.
  • José João Almeida & Alberto Simões. Linguagens específicas para a criação de dicionários. II Jornadas Internacionais Per-Fide Corpora & Terminologia. Universidade do Minho, Braga, 6-7 de junho de 2013.
  • Alberto Simões. Construção de Dicionários por Triangulação de Corpora Paralelos. I Workshop Per-fide. Construção, exploração e aplicação de Corpora Paralelos. Universidade do Minho, Braga, 16-17 de setembro de 2010.

  • Corpus-based language studies

  • Sílvia Araújo, Paula Pinto. Variation et traduction des constructions verbales figées portugaises. V Coloquio Lucentino. Fraseología, Variaciones, Diatopía y Traducción. Universidad de Alicante. 28, 29, 30 de Outubro 2014.
  • Sílvia Araújo. Les expressions idiomatiques et leurs équivalents de traduction sur la base du corpus parallèle Per-Fide - II Colloque franco-espagnol d’analyse de discours et d’enseignement des langues sur objectifs spécifiques - Universitat Politècnica de València, 3-5 setembro de 2014.
  • Sílvia Araújo, Pedro Trabulo. Da linguística de Corpus ao Ensino/Aprendizagem de Línguas: da teoria à prática. XVIII Encontro Internacional de Reflexão e Investigação (EIRI– 6 e 7 de maio de 2014), Universidade da UTAD.
  • Sílvia Araújo. Pour une intégration des corpus dans l’enseignement de la traduction: une étude de cas sur la polysémie verbale. I Coloquio Hermēneus: "Los estudios de traducción e interpretación basados en corpus: de lo global a lo local". Facultad de Traducción e Interpretación de Soria, Universidad de Valladolid, 26-27 de março de 2014.
  • Idalete Dias. Die idiomatische Synonymie in kontrastiver Perspektive (Deutsch – Spanisch - Portugiesisch). FRASESPAL 2011: Internationale Tagung zur kontrastiven Phraseologie Deutsch-Spanisch/Galicisch. Universidade de Santiago de Compostela, Espanha, 25 de novembro de 2011.
  • Conceição Varela. Da tradução jurídica nas/com as instituições da UE. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • Álvaro Iriarte. Colocações: mais do que combinações frequentes de palavras. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • Loïck Depecker [consultor]. Linguistique, terminologie et traduction: quelques éléments de réflexions à propos des corpus. I Jornadas Internacionais Per-Fide: Corpora & Tradução. Universidade do Minho, Braga, 22-23 de novembro de 2011.
  • Sílvia Araújo, Natália Fumega & Conceição Varela. Linguistique de corpus et traduction des constructions françaises en se voir INF/PP en portugais et en espagnol. Congrès AFLS: Regards nouveaux sur les liens entre théories, méthodes et données en linguistique française. Nancy, França, 8-10 de setembro de 2011.