microsoft
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 1 deletion b/‎.gitignore‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎rdagent/components/coder/data_science/conf.py‎
Lines changed: 40 additions & 0 deletions b/‎rdagent/components/coder/data_science/conf.py‎
Lines changed: 40 additions & 0 deletions
diff --git a/‎rdagent/components/coder/data_science/ensemble/eval.py‎
Lines changed: 5 additions & 9 deletions b/‎rdagent/components/coder/data_science/ensemble/eval.py‎
Lines changed: 5 additions & 9 deletions
diff --git a/‎rdagent/components/coder/data_science/feature/eval.py‎
Lines changed: 5 additions & 10 deletions b/‎rdagent/components/coder/data_science/feature/eval.py‎
Lines changed: 5 additions & 10 deletions
diff --git a/‎rdagent/components/coder/data_science/model/eval.py‎
Lines changed: 5 additions & 8 deletions b/‎rdagent/components/coder/data_science/model/eval.py‎
Lines changed: 5 additions & 8 deletions
diff --git a/‎rdagent/components/coder/data_science/model/exp.py‎
Lines changed: 0 additions & 8 deletions b/‎rdagent/components/coder/data_science/model/exp.py‎
Lines changed: 0 additions & 8 deletions
diff --git a/‎rdagent/components/coder/data_science/raw_data_loader/__init__.py‎
Lines changed: 8 additions & 6 deletions b/‎rdagent/components/coder/data_science/raw_data_loader/__init__.py‎
Lines changed: 8 additions & 6 deletions
diff --git a/‎rdagent/components/coder/data_science/raw_data_loader/eval.py‎
Lines changed: 5 additions & 9 deletions b/‎rdagent/components/coder/data_science/raw_data_loader/eval.py‎
Lines changed: 5 additions & 9 deletions
diff --git a/‎rdagent/components/coder/data_science/raw_data_loader/exp.py‎
Lines changed: 0 additions & 11 deletions b/‎rdagent/components/coder/data_science/raw_data_loader/exp.py‎
Lines changed: 0 additions & 11 deletions
diff --git a/‎rdagent/components/coder/data_science/workflow/eval.py‎
Lines changed: 6 additions & 11 deletions b/‎rdagent/components/coder/data_science/workflow/eval.py‎
Lines changed: 6 additions & 11 deletions
@@ -170,6 +170,6 @@ mlruns/
 
 # shell script
 *.out
-*.sh
+/*.sh
 .aider*
 rdagent/app/benchmark/factor/example.json
@@ -1,4 +1,15 @@
+from typing import Literal
+
 from rdagent.components.coder.CoSTEER.config import CoSTEERSettings
+from rdagent.utils.env import (
+    CondaConf,
+    DockerEnv,
+    DSDockerConf,
+    Env,
+    LocalEnv,
+    MLEBDockerConf,
+    MLECondaConf,
+)
 
 
 class DSCoderCoSTEERSettings(CoSTEERSettings):
@@ -8,3 +19,32 @@ class Config:
         env_prefix = "DS_Coder_CoSTEER_"
 
     max_seconds: int = 2400
+    env_type: str = "docker"
+    # TODO: extract a function for env and conf.
+
+
+def get_ds_env(conf_type: Literal["kaggle", "mlebench"] = "kaggle") -> Env:
+    """
+    Retrieve the appropriate environment configuration based on the env_type setting.
+
+    Returns:
+        Env: An instance of the environment configured either as DockerEnv or LocalEnv.
+
+    Raises:
+        ValueError: If the env_type is not recognized.
+    """
+    conf = DSCoderCoSTEERSettings()
+    assert conf_type in ["kaggle", "mlebench"], f"Unknown conf_type: {conf_type}"
+
+    if conf.env_type == "docker":
+        env_conf = DSDockerConf() if conf_type == "kaggle" else MLEBDockerConf()
+        env = DockerEnv(conf=env_conf)
+    elif conf.env_type == "conda":
+        env = LocalEnv(
+            conf=(
+                CondaConf(conda_env_name=conf_type) if conf_type == "kaggle" else MLECondaConf(conda_env_name=conf_type)
+            )
+        )
+    else:
+        raise ValueError(f"Unknown env type: {conf.env_type}")
+    return env
@@ -9,12 +9,11 @@
     CoSTEEREvaluator,
     CoSTEERSingleFeedback,
 )
+from rdagent.components.coder.data_science.conf import get_ds_env
 from rdagent.core.evolving_framework import QueriedKnowledge
 from rdagent.core.experiment import FBWorkspace, Task
-from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
 from rdagent.utils.agent.workflow import build_cls_from_json_with_retry
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 DIRNAME = Path(__file__).absolute().resolve().parent
 
@@ -45,11 +44,8 @@ def evaluate(
                 final_decision=False,
             )
 
-        ds_docker_conf = DSDockerConf()
-        ds_docker_conf.extra_volumes = {
-            f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"
-        }
-        de = DockerEnv(conf=ds_docker_conf)
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"}
 
         fname = "test/ensemble_test.txt"
         test_code = (DIRNAME / "eval_tests" / "ensemble_test.txt").read_text()
@@ -64,12 +60,12 @@ def evaluate(
         )
 
         implementation.inject_files(**{fname: test_code})
-        stdout, ret_code = implementation.execute_ret_code(env=de, entry=f"python {fname}")
+        stdout, ret_code = implementation.execute_ret_code(env=env, entry=f"python {fname}")
 
         stdout += f"\nNOTE: the above scripts run with return code {ret_code}"
 
         if "main.py" in implementation.file_dict:
-            workflow_stdout = implementation.execute(env=de, entry="python main.py")
+            workflow_stdout = implementation.execute(env=env, entry="python main.py")
             workflow_stdout = re.sub(r"=== Start of EDA part ===(.*)=== End of EDA part ===", "", workflow_stdout)
         else:
             workflow_stdout = None
 
@@ -7,12 +7,11 @@
     CoSTEEREvaluator,
     CoSTEERSingleFeedback,
 )
+from rdagent.components.coder.data_science.conf import get_ds_env
 from rdagent.core.evolving_framework import QueriedKnowledge
 from rdagent.core.experiment import FBWorkspace, Task
-from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
 from rdagent.utils.agent.workflow import build_cls_from_json_with_retry
-from rdagent.utils.env import DockerEnv, DSDockerConf
 from rdagent.utils.fmt import shrink_text
 
 DIRNAME = Path(__file__).absolute().resolve().parent
@@ -45,22 +44,18 @@ def evaluate(
                 final_decision=False,
             )
 
-        ds_docker_conf = DSDockerConf()
-        # TODO: we should /= 20 for the timeout period on debug component
-        ds_docker_conf.extra_volumes = {
-            f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"
-        }
-        de = DockerEnv(conf=ds_docker_conf)
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"}
 
         # TODO: do we need to clean the generated temporary content?
         fname = "test/feature_test.py"
         test_code = (DIRNAME / "eval_tests" / "feature_test.txt").read_text()
         implementation.inject_files(**{fname: test_code})
 
-        stdout = implementation.execute(env=de, entry=f"python {fname}")
+        stdout = implementation.execute(env=env, entry=f"python {fname}")
 
         if "main.py" in implementation.file_dict:
-            workflow_stdout = implementation.execute(env=de, entry="python main.py")
+            workflow_stdout = implementation.execute(env=env, entry="python main.py")
             workflow_stdout = re.sub(r"=== Start of EDA part ===(.*)=== End of EDA part ===", "", workflow_stdout)
         else:
             workflow_stdout = None
 
@@ -12,13 +12,13 @@
     CoSTEEREvaluator,
     CoSTEERSingleFeedback,
 )
+from rdagent.components.coder.data_science.conf import get_ds_env
 from rdagent.core.evolving_framework import QueriedKnowledge
 from rdagent.core.exception import CoderError
 from rdagent.core.experiment import FBWorkspace, Task
 from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
 from rdagent.utils.agent.workflow import build_cls_from_json_with_retry
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 DIRNAME = Path(__file__).absolute().resolve().parent
 ModelSingleFeedback = CoSTEERSingleFeedback
@@ -56,26 +56,23 @@ def evaluate(
                 final_decision=False,
             )
 
-        ds_docker_conf = DSDockerConf()
-        ds_docker_conf.extra_volumes = {
-            f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"
-        }
-        de = DockerEnv(conf=ds_docker_conf)
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"}
 
         fname = "test/model_test.py"
         test_code = (
             (DIRNAME / "eval_tests" / "model_test.txt").read_text().replace("model01", target_task.name)
         )  # only check the model changed this time
         implementation.inject_files(**{fname: test_code})
-        stdout = implementation.execute(env=de, entry=f"python {fname}")
+        stdout = implementation.execute(env=env, entry=f"python {fname}")
 
         if stdout is None:
             raise CoderError(
                 "The execution output contains too many progress bars and results in the LLM's token size exceeding the limit."
             )
 
         if "main.py" in implementation.file_dict:
-            workflow_stdout = implementation.execute(env=de, entry="python main.py")
+            workflow_stdout = implementation.execute(env=env, entry="python main.py")
             workflow_stdout = re.sub(r"=== Start of EDA part ===(.*)=== End of EDA part ===", "", workflow_stdout)
         else:
             workflow_stdout = None
 
@@ -1,14 +1,6 @@
-import pickle
-import site
-import traceback
-from pathlib import Path
 from typing import Dict, Optional
 
 from rdagent.components.coder.CoSTEER.task import CoSTEERTask
-from rdagent.core.experiment import Experiment, FBWorkspace
-from rdagent.core.utils import cache_with_pickle
-from rdagent.oai.llm_utils import md5_hash
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 
 # Because we use isinstance to distinguish between different types of tasks, we need to use sub classes to represent different types of tasks
 
@@ -38,7 +38,10 @@
 from rdagent.components.coder.CoSTEER.knowledge_management import (
     CoSTEERQueriedKnowledge,
 )
-from rdagent.components.coder.data_science.conf import DSCoderCoSTEERSettings
+from rdagent.components.coder.data_science.conf import (
+    DSCoderCoSTEERSettings,
+    get_ds_env,
+)
 from rdagent.components.coder.data_science.raw_data_loader.eval import (
     DataLoaderCoSTEEREvaluator,
 )
@@ -48,7 +51,6 @@
 from rdagent.core.scenario import Scenario
 from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 
 class DataLoaderMultiProcessEvolvingStrategy(MultiProcessEvolvingStrategy):
@@ -214,10 +216,10 @@ def __init__(
     def develop(self, exp):
         new_exp = super().develop(exp)
 
-        ds_docker_conf = DSDockerConf()
-        ds_docker_conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/{self.scen.competition}": "/kaggle/input"}
-        de = DockerEnv(conf=ds_docker_conf)
-        stdout = new_exp.experiment_workspace.execute(env=de, entry=f"python test/data_loader_test.py")
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/{self.scen.competition}": "/kaggle/input"}
+
+        stdout = new_exp.experiment_workspace.execute(env=env, entry=f"python test/data_loader_test.py")
         match = re.search(r"(.*?)=== Start of EDA part ===(.*)=== End of EDA part ===", stdout, re.DOTALL)
         eda_output = match.groups()[1] if match else None
         self.scen.eda_output = eda_output
 
@@ -12,11 +12,10 @@
 from rdagent.components.coder.CoSTEER.knowledge_management import (
     CoSTEERQueriedKnowledgeV2,
 )
+from rdagent.components.coder.data_science.conf import get_ds_env
 from rdagent.core.experiment import FBWorkspace, Task
-from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
 from rdagent.utils.agent.workflow import build_cls_from_json_with_retry
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 DIRNAME = Path(__file__).absolute().resolve().parent
 
@@ -48,25 +47,22 @@ def evaluate(
                 final_decision=False,
             )
 
-        ds_docker_conf = DSDockerConf()
-        ds_docker_conf.extra_volumes = {
-            f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"
-        }
-        de = DockerEnv(conf=ds_docker_conf)
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"}
 
         # TODO: do we need to clean the generated temporary content?
         fname = "test/data_loader_test.py"
         test_code = (DIRNAME / "eval_tests" / "data_loader_test.txt").read_text()
         implementation.inject_files(**{fname: test_code})
-        stdout = implementation.execute(env=de, entry=f"python {fname}")
+        stdout = implementation.execute(env=env, entry=f"python {fname}")
         match = re.search(r"(.*?)=== Start of EDA part ===(.*)=== End of EDA part ===(.*)", stdout, re.DOTALL)
         stdout_part_1, eda_output, stdout_part_2 = match.groups() if match else (stdout, None, "")
         stdout = stdout_part_1 + stdout_part_2
         if eda_output is not None and len(eda_output.split(" ")) > 10000:
             eda_output += "Length of EDA output is too long, truncated. Please reject this implementation and motivate it to reduce the length of EDA output."
 
         if "main.py" in implementation.file_dict:
-            workflow_stdout = implementation.execute(env=de, entry="python main.py")
+            workflow_stdout = implementation.execute(env=env, entry="python main.py")
             workflow_stdout = re.sub(r"=== Start of EDA part ===(.*)=== End of EDA part ===", "", workflow_stdout)
         else:
             workflow_stdout = None
 
@@ -1,15 +1,4 @@
-import pickle
-import site
-import traceback
-from pathlib import Path
-from typing import Dict, Optional
-
 from rdagent.components.coder.CoSTEER.task import CoSTEERTask
-from rdagent.core.experiment import Experiment, FBWorkspace
-from rdagent.core.utils import cache_with_pickle
-from rdagent.oai.llm_utils import md5_hash
-from rdagent.utils.agent.tpl import T
-from rdagent.utils.env import DockerEnv, DSDockerConf
 
 
 # Because we use isinstance to distinguish between different types of tasks, we need to use sub classes to represent different types of tasks
 
@@ -10,12 +10,11 @@
     CoSTEERMultiFeedback,
     CoSTEERSingleFeedback,
 )
+from rdagent.components.coder.data_science.conf import get_ds_env
 from rdagent.core.evolving_framework import QueriedKnowledge
 from rdagent.core.experiment import FBWorkspace, Task
-from rdagent.oai.llm_utils import APIBackend
 from rdagent.utils.agent.tpl import T
 from rdagent.utils.agent.workflow import build_cls_from_json_with_retry
-from rdagent.utils.env import DockerEnv, DSDockerConf, MLEBDockerConf
 
 DIRNAME = Path(__file__).absolute().resolve().parent
 
@@ -54,12 +53,8 @@ def evaluate(
                 final_decision=False,
             )
 
-        # DockerEnv for Kaggle Competition
-        ds_docker_conf = DSDockerConf()
-        ds_docker_conf.extra_volumes = {
-            f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"
-        }
-        de = DockerEnv(conf=ds_docker_conf)
+        env = get_ds_env()
+        env.conf.extra_volumes = {f"{DS_RD_SETTING.local_data_path}/sample/{self.scen.competition}": "/kaggle/input"}
 
         # # DockerEnv for MLEBench submission validation
         # mle_de_conf = MLEBDockerConf()
@@ -70,9 +65,9 @@ def evaluate(
         # mde.prepare()
 
         # Clean the scores.csv & submission.csv.
-        implementation.execute(env=de, entry=f"rm submission.csv scores.csv")
+        implementation.execute(env=env, entry=f"rm submission.csv scores.csv")
 
-        stdout = implementation.execute(env=de, entry=f"python main.py")
+        stdout = implementation.execute(env=env, entry=f"python main.py")
         stdout = re.sub(r"=== Start of EDA part ===(.*)=== End of EDA part ===", "", stdout)
 
         # Check score file
@@ -102,7 +97,7 @@ def evaluate(
         implementation.inject_files(**{"test/submission_format_test.py": base_check_code})
         # stdout += "----Submission Check 1-----\n"
         submission_check_out, submission_ret_code = implementation.execute_ret_code(
-            env=de, entry="python test/submission_format_test.py"
+            env=env, entry="python test/submission_format_test.py"
         )
         stdout += "\n" + submission_check_out