[FEAT] repo migration write: done
[gargantext.git] / src / Gargantext / Database / Action / Flow / List.hs
index 7c78f361c4a2bd945e1ec5247a418146b776d63c..224545e535d0c787ad8513471ae3362dc43ec8f0 100644 (file)
@@ -9,47 +9,76 @@ Portability : POSIX
 
 -}
 
-{-# OPTIONS_GHC -fno-warn-orphans    #-}
-
 {-# LANGUAGE ConstraintKinds         #-}
-{-# LANGUAGE RankNTypes              #-}
 {-# LANGUAGE ConstrainedClassMethods #-}
 {-# LANGUAGE ConstraintKinds         #-}
-{-# LANGUAGE DeriveGeneric           #-}
-{-# LANGUAGE FlexibleContexts        #-}
 {-# LANGUAGE InstanceSigs            #-}
-{-# LANGUAGE NoImplicitPrelude       #-}
-{-# LANGUAGE OverloadedStrings       #-}
 
 module Gargantext.Database.Action.Flow.List
     where
-import Data.Text (Text)
-import Control.Monad (mapM_)
+
+import Control.Concurrent
+import Control.Lens (view, (^.), (+~), (%~), at)
+import Control.Monad.Reader
 import Data.Map (Map, toList)
-import Data.Maybe (Maybe(..), catMaybes)
-import Gargantext.API.Ngrams (NgramsElement(..), putListNgrams)
-import Gargantext.Database.Schema.Ngrams -- (insertNgrams, Ngrams(..), NgramsIndexed(..), indexNgrams,  NgramsType(..), text2ngrams, ngramsTypeId)
+import Data.Maybe (catMaybes)
+import Data.Text (Text)
+import Gargantext.API.Ngrams.Types (HasRepoSaver(..), NgramsElement(..), NgramsPatch(..), NgramsRepoElement(..), NgramsTablePatch(..), NgramsTerm(..), RepoCmdM, ne_ngrams, ngramsElementToRepo, r_history, r_state, r_version, repoVar)
+import Gargantext.Core.Types (HasInvalidError(..), assertValid)
 import Gargantext.Core.Types.Main (ListType(CandidateTerm))
-import Gargantext.Database.Schema.NodeNgrams (NodeNgramsPoly(..), NodeNgramsW, listInsertDb, getCgramsId)
-import Gargantext.Database.Schema.Node_NodeNgramsNodeNgrams -- (insert_Node_NodeNgrams_NodeNgrams, Node_NodeNgrams_NodeNgrams(..))
-import Gargantext.Database.Types.Node -- (HyperdataDocument(..), NodeType(..), NodeId, UserId, ListId, CorpusId, RootId, MasterCorpusId, MasterUserId)
-import Gargantext.Database.Flow.Types
+import Gargantext.Core.Utils (something)
+import Gargantext.Database.Action.Flow.Types
+import Gargantext.Database.Admin.Types.Node
+import Gargantext.Database.Query.Table.NodeNgrams (NodeNgramsPoly(..), NodeNgramsW, listInsertDb, getCgramsId)
+import Gargantext.Database.Query.Table.Node_NodeNgramsNodeNgrams
+import Gargantext.Database.Schema.Ngrams (NgramsType(..))
 import Gargantext.Prelude
 import qualified Data.List as List
 import qualified Data.Map  as Map
-
+import qualified Data.Map.Strict.Patch as PM
+import qualified Gargantext.Database.Query.Table.Ngrams as TableNgrams
 
 -- FLOW LIST
--- | TODO check optimization
-mapNodeIdNgrams :: [DocumentIdWithNgrams a]
-                -> Map Ngrams (Map NgramsType (Map NodeId Int))
-mapNodeIdNgrams = Map.unionsWith (Map.unionWith (Map.unionWith (+))) . fmap f
-  where
-    f :: DocumentIdWithNgrams a
-      -> Map Ngrams (Map NgramsType (Map NodeId Int))
-    f d = fmap (fmap (Map.singleton nId)) $ document_ngrams d
-      where
-        nId = documentId $ documentWithId d
+-- 1. select specific terms of the corpus when compared with others langs
+-- (for now, suppose english)
+-- 2. select specific terms of the corpus when compared with others corpora (same database)
+-- 3. select clusters of terms (generic and specific)
+
+{-
+data FlowList = FlowListLang
+              | FlowListTficf
+              | FlowListSpeGen
+
+
+flowList_Tficf :: UserCorpusId
+               -> MasterCorpusId
+               -> NgramsType
+               -> (Text -> Text)
+               -> Cmd err (Map Text (Double, Set Text))
+flowList_Tficf u m nt f = do
+
+  u' <- Map.filter (\s -> Set.size s > 1) <$> getNodesByNgramsUser   u nt
+  m' <- Map.filter (\s -> Set.size s > 1) <$> getNodesByNgramsMaster u m
+
+  pure $ sortTficf Down
+       $ toTficfData (countNodesByNgramsWith f u')
+                     (countNodesByNgramsWith f m')
+
+flowList_Tficf' :: UserCorpusId
+               -> MasterCorpusId
+               -> NgramsType
+               -> Cmd err (Map Text (Double, Set Text))
+flowList_Tficf' u m nt f = do
+
+  u' <- Map.filter (\s -> Set.size s > 1) <$> getNodesByNgramsUser   u nt
+  m' <- Map.filter (\s -> Set.size s > 1) <$> getNodesByNgramsMaster u m
+
+  pure $ sortTficf Down
+       $ toTficfData (countNodesByNgramsWith f u')
+                     (countNodesByNgramsWith f m')
+
+-}
+
 
 ------------------------------------------------------------------------
 flowList_DbRepo :: FlowCmdM env err m
@@ -59,15 +88,17 @@ flowList_DbRepo :: FlowCmdM env err m
 flowList_DbRepo lId ngs = do
   -- printDebug "listId flowList" lId
   mapCgramsId <- listInsertDb lId toNodeNgramsW (Map.toList ngs)
-  let toInsert = catMaybes [ (,) <$> (getCgramsId mapCgramsId ntype <$> parent)
+  let toInsert = catMaybes [ (,) <$> (getCgramsId mapCgramsId ntype <$> (unNgramsTerm <$> parent))
                                  <*>  getCgramsId mapCgramsId ntype ngram
                            | (ntype, ngs') <- Map.toList ngs
-                           , NgramsElement ngram _ _ _ _ parent _ <- ngs'
+                           , NgramsElement (NgramsTerm ngram) _ _ _ _ parent _ <- ngs'
                            ]
   -- Inserting groups of ngrams
   _r <- insert_Node_NodeNgrams_NodeNgrams
      $ map (\(a,b) -> Node_NodeNgrams_NodeNgrams lId a b Nothing) toInsert
+
   listInsert lId ngs
+
   --trace (show $ List.filter (\n -> _ne_ngrams n == "versatile") $ List.concat $ Map.elems ngs) $ listInsert lId ngs
   pure lId
 ------------------------------------------------------------------------
@@ -83,9 +114,10 @@ toNodeNgramsW l ngs = List.concat $ map (toNodeNgramsW'' l) ngs
                   -> [NodeNgramsW]
     toNodeNgramsW'' l' (ngrams_type, elms) =
       [ NodeNgrams Nothing l' list_type ngrams_terms' ngrams_type Nothing Nothing Nothing 0 |
-       (NgramsElement ngrams_terms' _size list_type _occ _root _parent _children) <- elms
+       (NgramsElement (NgramsTerm ngrams_terms') _size list_type _occ _root _parent _children) <- elms
       ]
 
+
 toNodeNgramsW' :: ListId
                -> [(Text, [NgramsType])]
                -> [NodeNgramsW]
@@ -100,8 +132,69 @@ listInsert :: FlowCmdM env err m
              -> Map NgramsType [NgramsElement]
              -> m ()
 listInsert lId ngs = mapM_ (\(typeList, ngElmts)
-                             -> putListNgrams lId typeList ngElmts
-                             ) $ toList ngs
+                             -> putListNgrams lId typeList ngElmts) (toList ngs)
 
 ------------------------------------------------------------------------
 ------------------------------------------------------------------------
+
+
+-- NOTE
+-- This is no longer part of the API.
+-- This function is maintained for its usage in Database.Action.Flow.List.
+-- If the given list of ngrams elements contains ngrams already in
+-- the repo, they will be ignored.
+putListNgrams :: (HasInvalidError err, RepoCmdM env err m)
+              => NodeId
+              -> TableNgrams.NgramsType
+              -> [NgramsElement]
+              -> m ()
+putListNgrams _ _ [] = pure ()
+putListNgrams nodeId ngramsType nes = putListNgrams' nodeId ngramsType m
+  where
+    m = Map.fromList $ map (\n -> (n ^. ne_ngrams, ngramsElementToRepo n)) nes
+
+putListNgrams' :: (HasInvalidError err, RepoCmdM env err m)
+               => NodeId
+               -> TableNgrams.NgramsType
+               -> Map NgramsTerm NgramsRepoElement
+               -> m ()
+putListNgrams' nodeId ngramsType ns = do
+  -- printDebug "[putListNgrams'] nodeId" nodeId
+  -- printDebug "[putListNgrams'] ngramsType" ngramsType
+  -- printDebug "[putListNgrams'] ns" ns
+
+  let p1 = NgramsTablePatch . PM.fromMap $ NgramsReplace Nothing . Just <$> ns
+      (p0, p0_validity) = PM.singleton nodeId p1
+      (p, p_validity) = PM.singleton ngramsType p0
+  assertValid p0_validity
+  assertValid p_validity
+  {-
+  -- TODO
+  v <- currentVersion
+  q <- commitStatePatch (Versioned v p)
+  assert empty q
+  -- What if another commit comes in between?
+  -- Shall we have a blindCommitStatePatch? It would not ask for a version but just a patch.
+  -- The modifyMVar_ would test the patch with applicable first.
+  -- If valid the rest would be atomic and no merge is required.
+  -}
+  var <- view repoVar
+  liftBase $ modifyMVar_ var $ \r -> do
+    pure $ r & r_version +~ 1
+             & r_history %~ (p :)
+             & r_state . at ngramsType %~
+               (Just .
+                 (at nodeId %~
+                   ( Just
+                   . (<> ns)
+                   . something
+                   )
+                 )
+                 . something
+               )
+  saveRepo
+
+
+saveRepo :: ( MonadReader env m, MonadBase IO m, HasRepoSaver env )
+         => m ()
+saveRepo = liftBase =<< view repoSaver