Fix haddock parse error

[gargantext.git] / src / Gargantext / Core / Text / Terms / Multi.hs
diff --git a/src/Gargantext/Core/Text/Terms/Multi.hs b/src/Gargantext/Core/Text/Terms/Multi.hs

index 1e4147bc4daa4810158c53877ec99ce5b6a36d57..a35e8ef29a0c2d4980229a25cd5d8dfd63e8ce96 100644 (file)
--- a/src/Gargantext/Core/Text/Terms/Multi.hs
+++ b/src/Gargantext/Core/Text/Terms/Multi.hs
@@ -12,7 +12,7 @@ Multi-terms are ngrams where n > 1.
  -}
  
  
-module Gargantext.Core.Text.Terms.Multi (multiterms, multiterms_rake)
+module Gargantext.Core.Text.Terms.Multi (multiterms, multiterms_rake, tokenTagsWith)
    where
  
  import Data.Text hiding (map, group, filter, concat)
@@ -23,29 +23,44 @@ import Gargantext.Core (Lang(..))
  import Gargantext.Core.Types
  
  import Gargantext.Core.Text.Terms.Multi.PosTagging
+import Gargantext.Core.Text.Terms.Multi.PosTagging.Types
  import qualified Gargantext.Core.Text.Terms.Multi.Lang.En as En
  import qualified Gargantext.Core.Text.Terms.Multi.Lang.Fr as Fr
  
  import Gargantext.Core.Text.Terms.Multi.RAKE (multiterms_rake)
+import qualified Gargantext.Utils.JohnSnowNLP as JohnSnow
  
+
+-------------------------------------------------------------------
+type NLP_API = Lang -> Text -> IO PosSentences
+
+-------------------------------------------------------------------
+-- To be removed
  multiterms :: Lang -> Text -> IO [Terms]
-multiterms lang txt = concat
-                   <$> map (map tokenTag2terms)
-                   <$> map (filter (\t -> _my_token_pos t == Just NP)) 
+multiterms = multiterms' tokenTag2terms
+ 
+multiterms' :: (TokenTag -> a) -> Lang -> Text -> IO [a]
+multiterms' f lang txt = concat
+                   <$> map (map f)
+                   <$> map (filter (\t -> _my_token_pos t == Just NP))
                     <$> tokenTags lang txt
  
+-------------------------------------------------------------------
  tokenTag2terms :: TokenTag -> Terms
  tokenTag2terms (TokenTag ws t _ _) =  Terms ws t
  
  tokenTags :: Lang -> Text -> IO [[TokenTag]]
-tokenTags lang s = map (groupTokens lang) <$> tokenTags' lang s
+tokenTags EN txt = tokenTagsWith EN txt corenlp
+tokenTags FR txt = tokenTagsWith FR txt JohnSnow.nlp
+tokenTags _  _   = panic "[G.C.T.T.Multi] NLP API not implemented yet"
  
+tokenTagsWith :: Lang -> Text -> NLP_API -> IO [[TokenTag]]
+tokenTagsWith lang txt nlp = map (groupTokens lang)
+                          <$> map tokens2tokensTags
+                          <$> map _sentenceTokens
+                          <$> _sentences
+                          <$> nlp lang txt
  
-tokenTags' :: Lang -> Text -> IO [[TokenTag]]
-tokenTags' lang t =  map tokens2tokensTags
-                     <$> map _sentenceTokens
-                     <$> _sentences
-                     <$> corenlp lang t
  
  ---- | This function analyses and groups (or not) ngrams according to
  ----   specific grammars of each language.