neo4j——导入owl或rdf文件

2023-07-18  本文已影响0人  林几许

一:如果是owl文件,需要先转换成rdf文件(df2rdf)

java -jar rdf2rdf-1.0.2-2.3.1.jar wj.owl wj.rdf

这样你就能得到一个rdf文件

二:导入rdf文件,需要给neo4j安装一个组件neosemantics

# 高版本使用上面这句配置(4.0版本之后)
dbms.unmanaged_extension_classes=n10s.endpoint=/rdf
# 低版本使用上面这句配置(4.0版本之前)
dbms.unmanaged_extension_classes=semantics.extension=/rdf
call dbms.procedures()

三:导入RDF文件

call n10s.graphconfig.init();
CREATE CONSTRAINT n10s_unique_uri ON (r:Resource) ASSERT r.uri IS UNIQUE;
call n10s.rdf.import.fetch( "file:////home/neo4j-chs-community-4.4.18-unix/wj.rdf", "RDF/XML"); 

四:处理数据前缀

1.uri显示前有地址,可我们只想要名称

MATCH (n)
SET n.uri = REPLACE(n.uri, 'http://purl.obolibrary.org/obo/go#', '')
RETURN n
from py2neo import Graph

# 连接到数据库(改成自己的ip和账号密码)
graph = Graph("neo4j://0.0.0.0:7687", auth=("neo4j", "xxx"))

# 查询所有关系类型
relationship_types_query = "CALL db.relationshipTypes() YIELD relationshipType RETURN relationshipType"
relationship_types = graph.run(relationship_types_query).to_data_frame()

# 遍历所有关系类型,去掉 'ns0' 前缀并更新关系名称
for index, row in relationship_types.iterrows():
    old_type = row['relationshipType']
    if old_type.startswith("ns0__"):
        new_type = old_type[len("ns0__"):].replace("“","").replace("”","")
        update_query = f"""
        MATCH (a)-[r:{old_type}]->(b)
        CREATE (a)-[r_new:{new_type}]->(b)
        SET r_new = r
        WITH r
        DELETE r
        """
        graph.run(update_query)
from py2neo import Graph

# 连接到数据库(改成自己的ip和账号密码)
graph = Graph("neo4j://000.0.0.0:7687", auth=("neo4j", "xxx"))

# 创建 NodeMatcher 实例
matcher = NodeMatcher(graph)
nodes = matcher.match()

# 遍历属性查找符合条件的并修改
for node in nodes:
    for key in list(node.keys()):
        if key.startswith('ns0__'):
            new_key = key[len("ns0__"):]
            node[new_key] = node[key]
            del node[key]
    graph.push(node)
from py2neo import Graph

# 连接到数据库(改成自己的ip和账号密码)
graph = Graph("neo4j://000.0.0.0:7687", auth=("neo4j", "xxxx"))

# 查询所有节点及其标签
query = "MATCH (n) RETURN n"
result = graph.run(query)

# 遍历所有节点
for record in result:
    node = record["n"]
    labels = node.labels

    # 删除所有标签中的ns0__字符
    for label in labels:
        if "ns0__" in label:
            print(label)
            new_label=label.replace("ns0__", "")
            node.add_label(new_label)
            node.remove_label(label)
    graph.push(node)
上一篇 下一篇

猜你喜欢

热点阅读