<!-- AUTOGENERATED FILE: ALL EDITS WILL BE LOST!!! -->
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta charset="UTF-8">
<title>GATE Version 3.1 release (April 2006)</title>
<style type="text/css">
<!--
html, body {
  background: #fff;
  color: #000;
  font-family: sans-serif;
}
h1,h2,h3,h4,h5,p,ul,ol { font-family: sans-serif; }
pre { font-family: monospace; }
h3.navhead {
  font-size: 100%;
}
div.banner {
  border: none;
  margin-right: 0px;
  margin-left: 0px;
  padding: 0.09em;
  text-align: center;
  font-weight: bold; 
}
div.banner a:link, div.banner {
  background: #A0D0F0;
  color: #000000;
}
div.banner a:active {
  background: #000000;
  color: #FFFFFF;
}
div.banner a:hover {
  background: #000000;
  color: #FFFFFF;
-->
</style>
</head>
<body bgcolor="#FFFFFF" text="#000000">
<h1>GATE Version 3.1 release (April 2006)</h1>

<h2>1. Major new features</h2>

<h3>1.1. Support for UIMA</h3>


<p>
UIMA (<a href="http://www.research.ibm.com/UIMA/)">http://www.research.ibm.com/UIMA/)</a> is a language processing framework
developed by IBM. UIMA and GATE share some functionality but are
complementary in most respects. GATE now provides an interoperability layer
to allow UIMA applications to include GATE components in their processing
and vice-versa. For full information, see chapter 14 of the User Guide.
<h3>1.2. New Ontology API</h3>


<p>
The ontology layer has been rewritten in order to provide an abstraction
layer between the model representation and the tools used for input and
output of the various representation formats. An implementation that uses
Jena 2 (<a href="http://jena.sourceforge.net/ontology)">http://jena.sourceforge.net/ontology)</a> for reading and writing OWL
and RDF(S) is provided.
<h3>1.3. Ontotext Japec Compiler</h3>


<p>
Japec is a compiler for JAPE grammars developed by Ontotext Lab. It has some
limitations compared to the standard JAPE transducer implementation, but can
run JAPE grammars up to five times as fast. By default, GATE still uses the
stable JAPE implementation, but if you want to experiment with Japec, see
section 9.27 of the User Guide.

<p>

<h2>2. Other new features and improvements</h2>

<ul>
<li>
Addition of a new JAPE matching style "all". This is similar to Brill, but
  once all rules from a given start point have matched, the matching will
  continue from the next offset to the current one, rather than from the
  position in the document where the longest match finishes. More details can
  be found in Section 7.2.
</li>
<li>
Limited support for loading PDF and Microsoft Word document formats. Only
  the text is extracted from the documents, no formatting information is
  preserved.
</li>
<li>
The Buchart parser has been deprecated and replaced by a new plugin called
  SUPPLE - the Sheffield University Prolog Parser for Language Engineering.
  Full details, including information on how to move your application from
  Buchart to SUPPLE, is in section 9.12.
</li>
<li>
The Hepple POS Tagger is now open-source. The source code has been
  included in the GATE distribution, under src/hepple/postag. More
  information about the POS Tagger can be found in Section 8.4.
</li>
<li>
Minipar is now supported on Windows. minipar-windows.exe, a modified
  version of pdemo.cpp is added under the gate/plugins/minipar directory to
  allow users to run Minipar on windows platform. While using Minipar on
  Windows, this binary should be provided as a value for miniparBinary
  parameter. For full information on Minipar in GATE, see section 9.10 of
  the User Guide.
</li>
<li>
The XmlGateFormat writer(Save As Xml from GATE GUI, gate.Document.toXml()
  from GATE API) and reader have been modified to write and read GATE
  annotation IDs. For backward compatibility reasons the old reader has been
  kept. This change fixes a bug which manifested in the following situation:
  If a GATE document had annotations carrying features of which values were
  numbers representing other GATE annotation IDs, after a save and a reload
  of the document to and from XML, the former values of the features could
  have become invalid by pointing to other annotations. By saving and
  restoring the GATE annotation ID, the former consistency of the GATE
  document is maintained. For more information, see Section 6.5.2 of the
  User Guide.
</li>
<li>
The NP chunker and chemistry tagger plugins have been updated. Mark
  Greenwood has relicenced them under the LGPL, so their source code has
  been moved into the GATE distribution. See sections 9.3 and 9.15 for
  details.
</li>
<li>
The Tree Tagger wrapper has been updated with an option to be less strict
  when characters that cannot be represented in the tagger's encoding are
  encountered in the document. Details are in section 9.7.
</li>
<li>
JAPE Transducers can be serialized into binary files. The option to load
  serialized version of JAPE Transducer (an init-time parameter
  binaryGrammarURL) is also implemented which can be used as an alternative
  to the parameter grammarURL. More information can be found in Section 7.7.
</li>
<li>
On Mac OS, GATE now behaves more naturally. The application menu items
  and keyboard shortcuts for About and Preferences now do what you would
  expect, and exiting GATE with command-Q or the Quit menu item properly
  saves your options and current session.
</li>
<li>
Updated versions of Weka (3.4.6) and Maxent (2.4.0).
</li>
<li>
Optimisation in gate.creole.ml: the conversion of AnnotationSet into ML
  examples is now faster.
</li>
<li>
It is now possible to create your own implementation of Annotation, and
  have GATE use this instead of the default implementation. See
  AnnotationFactory and AnnotationSetImpl in the gate.annotation package for
  details.
</li>
</ul>

<p>

<h2>3. Bug fixes</h2>

<ul>
<li>
The Tree Tagger wrapper has been updated in order to run under Windows.
  See 9.7.
</li>
<li>
The SUPPLE parser has been made more user-friendly. It now produces more
  helpful error messages if things go wrong. Note that you will need to
  update any saved applications that include SUPPLE to work with this
  version - see section 9.12 of the User Guide for details.
</li>
<li>
Miscellaneous fixes in the Ontotext JapeC compiler.
</li>
<li>
Optimization : the creation of a Document is much faster.
</li>
<li>
Google plugin: The optional pagesToExclude parameter was causing a
  NullPointerException when left empty at run time. Full details about the
  plugin functionality can be found in section 9.20.
</li>
<li>
Minipar, SUPPLE, TreeTagger: These plugins that call external processes
  have been fixed to cope better with path names that contain spaces. Note
  that some of the external tools themselves still have problems handling
  spaces in file names, but these are beyond our control to fix. If you want
  to use any of these plugins, be sure to read the documentation to see if
  they have any such restrictions.
</li>
<li>
When using a non-default location for GATE configuration files, the
  configuration data is saved back to the correct location when GATE exits.
  Previously the default locations were always used.
</li>
<li>
Jape Debugger: ConcurrentModificationException in JAPE debugger. The JAPE
  debugger was generating a ConcurrentModificationException during an attempt
  to run ANNIE. There is no exception when running without the debugger
  enabled. As result of fixing one unnesesary and incorrect callback to
  debugger was removed from SinglePhaseTransducer class.
</li>
<li>
Plus many other small bugfixes...
</li>
</ul>
</body>
</html>