Newer
Older
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import shutil
import unittest
from unitex.utils.fsa import Automaton
class Arguments:
def __init__(self, language=None):
self.__arguments = {}
self.__arguments["raw"] = "data/grf-raw.dot"
self.__arguments["determinized"] = "data/grf-determinized.dot"
self.__arguments["minimized"] = "data/grf-minimized.dot"
self.__arguments["automaton"] = None
def __getitem__(self, key):
if key not in self.__arguments:
raise KeyError("Argument '%s' not found ..." % key)
return self.__arguments[key]
def __setitem__(self, key, value):
self.__arguments[key] = value
class TestUnitexUtils(unittest.TestCase):
@classmethod
def setUpClass(self):
self._arguments = Arguments()
@classmethod
def tearDownClass(self):
if os.path.exists(self._arguments["raw"]):
os.remove(self._arguments["raw"])
if os.path.exists(self._arguments["determinized"]):
os.remove(self._arguments["determinized"])
if os.path.exists(self._arguments["minimized"]):
os.remove(self._arguments["minimized"])
def test_01_automaton_build(self):
self._arguments["automaton"] = Automaton("MWU Test")
path1 = "président français de la république"
path2 = "président de la république"
path3 = "ministre islandais de la défense"
path4 = "ministre islandais à la défense"
path5 = "secrétaire d'état à la défense"
path6 = "secrétaire d'état"
path7 = "secrétaire"
path8 = "adjoint au secrétaire d'état"
path9 = "adjoint au secrétaire d'état à la défense"
self._arguments["automaton"].add_path(path1.split())
self._arguments["automaton"].add_path(path2.split())
self._arguments["automaton"].add_path(path3.split())
self._arguments["automaton"].add_path(path4.split())
self._arguments["automaton"].add_path(path5.split())
self._arguments["automaton"].add_path(path6.split())
self._arguments["automaton"].add_path(path7.split())
self._arguments["automaton"].add_path(path8.split())
self._arguments["automaton"].add_path(path9.split())
self._arguments["automaton"].todot(self._arguments["raw"])
self.assertTrue(os.path.exists(self._arguments["raw"]), "Automaton building failed!")
def test_02_automaton_determinize(self):
self._arguments["automaton"].determinize()
self._arguments["automaton"].todot(self._arguments["determinized"])
self.assertTrue(os.path.exists(self._arguments["determinized"]), "Automaton determinization failed!")
def test_03_automaton_minimize(self):
self._arguments["automaton"].minimize()
self._arguments["automaton"].todot(self._arguments["minimized"])
self.assertTrue(os.path.exists(self._arguments["minimized"]), "Automaton minimization failed!")
if __name__ == '__main__':
unittest.main()