한국어 사이트는 4월 1일부로 종료됩니다. 그동안 이용해 주셔서 감사합니다.

Scientific Data

사이언티픽 데이터(Scientific Data)는 과학적으로 가치 있는 데이터셋에 대한 기술 및 과학 데이터의 공유와 재사용을 진전시키는 연구를 피어 리뷰 과정을 거쳐 출간하는 오픈 액세스 저널입니다.  

사이언티픽 데이터는 주요 컨소시엄에서 단일 연구 그룹에 이르기까지 크고 작은 데이터셋의 기술을 포함하여 광범위한 연구 분야의 투고를 환영합니다. 사이언티픽 데이터는 데이터 재사용을 돕고, 데이터를 공유한 사람에게 크레딧을 제공하는 새로운 형태의 출간물인 데이터 디스크립터(Data Descriptor)를 주로 출간합니다.

모든 콘텐츠는 매월 수백만 명 이상의 과학자가 방문하는 nature.com에 게재됩니다. 출간물은 또한 펍메드(PubMed), MEDLINE, 구글 학술검색(Google Scholar) 및 클래리베이트의 웹 오브 사이언스에 게재되며, 자동으로 펍메드 센트럴(PubMed Central)에 보관됩니다.

편집위원, 자문위원 및 편집위원회

원칙

사이언티픽 데이터는 과학적으로 가치 있는 데이터셋에 대한 기술 및 과학 데이터의 공유와 재사용을 진전시키는 연구를 출간하는 온라인 전용 오픈 액세스 저널입니다. 해당 저널의 주요 콘텐츠 유형인 데이터 디스크립터는 기존의 서술 내용을 구조화 및 큐레이션 기술(메타데이터)과 결합하여 데이터 공유 및 재사용에 새로운 뼈대를 제공합니다. 이를 통해 궁극적으로 과학적 발견의 속도를 가속화할 수 있을 것으로 믿고 있습니다. 이는 과학 데이터의 관리에 있어서 연구 데이터는 찾을 수 있어야 하며(Findable), 접근 가능해야 하고(Accessible), 상호 운용 가능하며(Interoperable), 또한 재사용 가능(Reusable)해야 함을 선언하는 FAIR 원칙(FAIR Principles)에 따라 작성되었습니다.

공로 인정(Credit)

FAIR 원칙에 따라 데이터를 공유하는 과학자는 공로를 인정받아야 합니다. 사이언티픽 데이터를 통한 출판에는 다음과 같은 장점이 있습니다.

  • 데이터셋 생성을 위해 인용 가능하며, 피어 리뷰 과정을 거친 크레딧을 제공합니다.
  • 기존의 논문에 저자로 참여할 수 없었던 연구원의 공로를 인정받을 수 있습니다.
  • 기존의 연구 저널에 적합하지 않았으나 가치 있는 데이터셋의 출간이 가능합니다.

재사용(Reuse)

표준화되고 상세한 기술을 통해 데이터 검색과 사용이 더욱 쉬워집니다. 데이터 디스크립터는 다음과 같은 역할을 합니다.

  • 표준화 및 큐레이션을 거친 실험 메타데이터를 포함하여 해석, 재사용 및 재생산이 필요한 정보를 제공합니다.
  • 데이터 파일, 코드 및 워크플로우가 보관되어 있는 하나 이상의 신뢰할 수 있는 데이터 저장소에 연결합니다.
  • 연구 데이터의 재사용 가능성을 보여주고 촉진함으로써, 연구 지원 기관의 데이터 관리 요구 사항 중 상당한 부분을 충족할 수 있습니다.

품질(Quality)

발표된 데이터가 진정으로 재사용 가치가 있다면, 실험적인 엄격성과 기술의 완전성을 검증하기 위한 비판적 평가가 필요합니다.

  • 집중적인 피어 리뷰를 통해 기술적 품질과 각 데이터 디스크립터 및 연관 데이터셋의 완전성을 평가합니다.
  • 광범위한 분야의 저명한 전문가로 구성된 아카데믹 편집위원회에 의해 정립된 표준을 따릅니다.
  • 편집자와 심사위원이 커뮤니티 표준과의 일치를 보장합니다.

발견(Discovery)

과학자는 연구와 관련된 데이터셋을 쉽게 찾을 수 있어야 합니다. 사이언티픽 데이터의 콘텐츠는 다음과 같은 특징을 지닙니다.

  • 일정한 검색과 발견이 가능합니다.
  • 연관된 저널 논문과 데이터 저장소 기록의 유효한 링크를 제공합니다.
  • 전체 데이터 디스크립터와 더불어 부분적으로 기계 판독이 가능한 메타데이터를 제공하는 데이터 및 텍스트-마이너 친화적 콘텐츠입니다.
  • 저자가 광범위한 데이터 유형을 아우르며 관련 데이터셋을 찾을 수 있도록 도움으로써 통합 분석을 가속화합니다.

개방성(Open)

과학자들이 동료를 쉽게 만나고 협력할 수 있을 때 가장 역량을 발휘할 수 있다고 믿으며, 따라서 사이언티픽 데이터는 다음과 같은 목표를 갖고 있습니다.

  • 실험 방법론, 관찰 및 데이터 수집에서 투명성을 제공합니다.
  • 수정 및 2차 작업물 생성을 허용하는 오픈 라이선스를 사용합니다.
  • 학제간 연구 장벽을 허물어서 이해, 연결 및 협력을 용이하게 합니다.
  • 과학자, 정책 입안자, NGO, 회사, 연구 지원자 및 일반인 모두가 필요한 데이터를 찾고 접근하여, 이해하고, 재사용할 수 있도록 보장합니다.

서비스(Service)

사이언티픽 데이터는 저자와 독자 모두에게 뛰어난 서비스를 제공하기 위해 최선을 다하고 있습니다.

  • 전문 인하우스 큐레이션은 표준화되고 균일하게 검색 가능한 콘텐츠를 보장합니다.
  • 저자의 특정 데이터 유형에 맞는 저장소가 존재하지 않더라도, 데이터셋을 figshare 혹은 Dryad에 보관하면 투고 시 피어 리뷰 과정을 빠르게 마칠 수 있습니다.
  • 네이처 리서치의 기술과 경험을 통해 콘텐츠의 강력한 검색 기능과 링크, 이미지화 기능을 제공합니다.
  • 데이터 디스크립터의 빠른 리뷰와 출판을 통해 저자의 데이터를 시의 적절하게 출판할 수 있습니다.

오픈 액세스 자세히 보기

자주 묻는 질문

더 자세한 문의사항이나 기타 질문이 있으신 경우 로 이메일을 보내주시기 바랍니다.

사이언티픽 데이터는 과학적으로 가치 있는 데이터셋에 대한 기술 및 과학 데이터의 공유와 재사용을 진전시키는 연구를 피어 리뷰 과정을 거쳐 출간하는 오픈 액세스 저널입니다. 네이처 리서치에서 출시하였으며, 가치 있는 데이터의 발견 가능성, 재현성 및 재사용을 가능하게 하는 것을 목표로 합니다. 사이언티픽 데이터는 주로 기존 저널 논문의 서술 내용 특징과, 실험적 워크플로우를 설명하고 공개적으로 아카이브된 데이터 기록을 가리키는 구조화되고 선별된 메타데이터를 결합한 새로운 유형의 간행물인 데이터 디스크립터를 출간합니다.

사이언티픽 데이터는 크고 작은 데이터 설명, 주요 컨소시엄부터 단일 연구소를 포함한 광범위한 자연과학의 세부 연구 분야에서 투고를 받고 있습니다. 현재 생명, 의생명과학 및 환경과학 분야의 데이터셋에 초점을 맞추고 있습니다. 해당 분야 외의 데이터셋 또한 사전 투고 문의를 통해 문의하여 주시기 바랍니다. 당사는 또한 사회 과학, 특히 자연 과학과 사회 과학의 전통적인 경계를 넘어서는 통합 분석에 사용될 수 있는 양적 데이터셋에 대한 설명도 기꺼이 고려할 것입니다.

사이언티픽 데이터는 실험 데이터 및 관측 데이터셋 뿐만 아니라 전산 데이터 또는 큐레이션된 데이터셋을 기술한 원고도 고려하고 있습니다. 어떠한 경우에도 저자는 결과 데이터의 품질을 설득력있게 입증해야 하며, 폭넓은 가치를 통해 커뮤니티를 지지해야 합니다.

사이언티픽 데이터에는 전 세계 연구 기관의 데이터 표준 전문가 및 실험 및 전산 과학자들로 이루어진 편집위원회가 있습니다. 편집위원들은 모든 원고의 리뷰 과정에서 협력하며, 데이터를 생성하는 데 사용된 절차의 기술적 품질, 결과 데이터셋의 재사용 가치, 데이터 기술의 완전성 및 기존 커뮤니티 표준과의 일치 여부를 평가하기 위한 심사위원을 선정합니다.

사이언티픽 데이터의 데이터 디스크립터는 인용 가능하며, 다음 형식의 DOI를 통해 출간됩니다:
10.1038/sdata.YYYY.manuscriptNumber

사이언티픽 데이터의 콘텐츠는 펍메드, MEDLINE, 구글 학술검색 및 클래리베이트의 웹 오브 사이언스에 색인 등재되어 있으며, 펍메드 센트럴에서도 찾으실 수 있습니다. 사이언티픽 데이터는 또한 DOAJ에도 등재되어 있습니다. 사이언티픽 데이터를 통해 출간된 논문은 네이처 리서치의 디지털 보존 정책 및 과정을 통해 보존됩니다. 이는 사이언티픽 데이터가 CLOCKSS와 Portico에 아카이빙 되는 것도 포함합니다.

2017년 사이언티픽 데이터의 저널 지표는 다음과 같습니다.

  • 2-year impact factor: 5.305
  • 5-year impact factor: 5.862
  • Immediacy index: 0.843
  • Eigenfactor® score: 0.00855
  • Article influence score: 2.597

자세한 지표는 네이처 리서치 저널 지표 페이지에서 확인할 수 있습니다.

초록과 색인에 사용되는 올바른 약어는 “Sci. Data” 입니다.

사이언티픽 데이터오픈 액세스입니다. 저희가 게재할 때는 모든 저자에게 연구 게재를 위한 논문 처리 비용(APC)을 요구합니다. 오픈 액세스 페이지에서 논문 처리 비용(APC), 라이선스 및 무료 오픈 액세스 연구 지원 서비스에 대한 정보를 확인할 수 있습니다.

피어 리뷰부터 큐레이션, 전용 서버에 최종 논문 게재 등 출판 과정의 모든 단계에서 비용이 발생합니다. 따라서 많은 저널이 부과하는 구독료 대신 저자에게 논문 처리 비용(APC)을 요청합니다. 이 비용을 지불하시면 저자는 최종 데이터 디스크립터의 PDF를 출간 즉시 웹사이트나 기관 저장소, 또는 기타 무료 출판 서버에 게재할 수 있습니다.

데이터 디스크립터는 기본적으로 저작자 표시(CC BY) 라이선스 (Creative Commons Attribution 4.0 International Licence) 하에 출간됩니다. 저작자 표시(CC BY) 라이선스는 오픈 액세스 자료를 광범위하게 배포하고 재사용할 수 있어 많은 연구 지원 기관에서 선호하고 있습니다. 이 라이선스에 따라 사용자는 저작자 또는 라이선스 제공자가 지정한 방식으로 원저작자를 표시하는 조건 하에 상업적 용도를 포함하여 해당 컨트리뷰션을 자유롭게 공유(복제, 배포, 전송) 및 수정(적용)할 수 있습니다. 데이터 디스크립터의 메타데이터는 최대한의 재사용을 촉진하기 위하여 CC0 권리포기 라이선스로 제공할 수 있습니다. 자세한 사항은 네이처 리서치 라이선스 정책크리에이티브 커먼즈 라이선스에서 확인할 수 있습니다.

사이언티픽 데이터는 해당 저자가 세계은행이 정의한 세계 최저 소득 국가에 기반을 둔 논문에 대해 APC를 면제하고 있습니다. 기타 임의적인 APC 면제는 사례별로 고려되며, 재정적인 지원이 필요한 경우 수여될 수 있습니다. 자세한 사항은 비용 면제 정책에서 확인하시기 바랍니다.

데이터 디스크립터는 사이언티픽 데이터를 통해 출간되는 주요 유형의 논문이며, 실험, 관측, 전산 또는 큐레이션 데이터의 상세한 설명을 제공하는 새로운 카테고리의 간행물입니다. 서술적인 내용을 구조화되고 큐레이션된 정보와 결합하여 기존의 기본 데이터셋의 해석, 검색 및 재사용을 극대화하고, 데이터셋의 기원에 대한 정보와 이를 유출하기 위해 사용된 실험 단계에 대한 정보 및 결과 데이터 파일로 이끄는 링크를 제공합니다. 데이터 디스크립터는 새로운 과학 가설에 대한 실험, 새로운 과학적 통찰력을 제공하기 위한 광범위한 분석 또는 근본적으로 새로운 과학적 방법에 대한 설명을 포함하지 않아야 합니다.

원고는 상세한 피어 리뷰 절차를 거치며, 관리 편집자, 명예 아카데믹 편집자 및 편집위원이 토의를 통해 결정합니다. 원고가 사이언티픽 데이터가 다루는 범주에 포함되며 충분히 재사용 가치가 있는 데이터셋을 포함하는 경우에만 리뷰 과정을 거칩니다. 편집위원은 각 투고된 원고의 피어 리뷰를 감독합니다.

심사위원은 데이터 생성에 사용된 절차의 기술적 품질, 결과 데이터셋의 재사용 가치, 기존 커뮤니티 표준과의 일치 여부 및 데이터 설명의 완전성을 평가합니다. 대부분의 데이터 디스크립터는 데이터 표준 전문가를 비롯하여 연관 실험 기법에 전문성을 가진 최소 한 명 이상의 과학자가 리뷰합니다.

사이언티픽 데이터의 원고 접수는 데이터셋과 연관된 발견의 영향 또는 새로움에 근거하지 않으며, 데이터 디스크립터에 심층 분석이나 새로운 과학적 결론을 포함할 것을 기대하지 않습니다. 그러나 저자에게는 데이터 생성에 사용된 실험이나 절차의 엄격함과 기술적 품질을 제공해야 하며, 필요할 때마다 품질 관리 실험의 증거를 요청할 수 있습니다. 또한 심사위원은 데이터를 보완하기 위한 추가 실험을 요구할 수 있습니다.

심사위원 가이드에서 더 많은 내용을 확인할 수 있습니다.

출간된 데이터 디스크립터 원고에는 저자가 수행한 조사(Investigation), 연구(Study) 및 분석(Assay)을 설명하는 ISA-Tab 메타데이터 기록으로 구성되는, 구조화된 내용이 수반됩니다. 이 기록은 큐레이션 과정 중에 생성되며, 샘플과 대상의 출처를 나타내고 실험 워크플로우를 개괄하는 통제된 어휘 및 용어를 사용하여 데이터 검색과 재사용을 용이하게 합니다. 이들은 데이터셋 주석의 내부 일관성 및 완전성을 보장하고 커뮤니티에서 개발한 최소 정보 요구 사항 및 용어와의 일치를 보장합니다(FAIR 공유의 목록 참조).

각 데이터 디스크립터는 초록 다음에 나타나는 ‘구조화된 요약’ 표와 함께 출간됩니다. 이 표는 각 원고에 대한 큐레이션 과정 중에 작성된 기계 판독 가능 메타데이터 파일에서 생성됩니다. 저자는 출간 이전에 교정 과정에서 이 표를 볼 수 있습니다. 표에 포함되는 용어는 가능한 경우 커뮤니티 온톨로지에서 가져온 것으로 데이터 검색을 지원하도록 설계되어 있습니다. 데이터 큐레이션 편집자는 저자와 함께 구조화 요약 표의 용어가 실제로 정확하고 다른 데이터 디스크립터의 유사한 데이터셋에 할당된 용어와 일치하는지 확인합니다.

구조화된 요약 표가 매우 긴 경우 데이터 디스크립터의 PDF 파일에서 보이지 않을 수 있음을 참고하시기 바랍니다. 온라인 논문에서는 전체를 볼 수 있습니다.

사이언티픽 데이터는 전통적인 결과-기반 논문을 게재하지 않으며, 중요한 데이터의 재사용을 용이하게 하기 위하여 만들어졌기 때문에 예비, 또는 근거가 약한 결과를 설명하는 원고는 승인하지 않습니다. 원고가 거절된 경우 저자는 다른 저널에 원고를 전송할 수 있으나, 특히 재사용 가능성이 높은 데이터셋을 설명하는 경우에는 피어 리뷰 과정을 위해 특정 범위 및 형식 요구 사항에 맞게 원고를 수정해야 합니다. 또한 데이터 품질 및 재사용 가치에 관한 해당 저널의 편집 표준은 다른 저널보다 엄격 할 수 있습니다.

공개를 위한 데이터 디스크립터의 승인은 데이터를 생성하는 데 사용된 절차의 기술적 엄격함, 데이터의 재사용 가치 및 데이터 기술의 완전성을 기반으로 합니다. 기존 커뮤니티 표준과 일치하는 데이터셋은 인하우스 큐레이션을 통해 아카이브되며, 데이터 디스크립터의 출간과 동시에 전체 연구 데이터의 공개가 요구됩니다. 자세한 사항은 심사위원 가이드를 확인하시기 바랍니다.

데이터 디스크립터는 기존의 연구 논문을 보완하도록 고안되었으며, 다른 출판물에서 분석되는 데이터셋을 설명하는 데 사용될 수 있습니다.

네이처 자매 저널은 해당 원고가 데이터의 기술적 분석 차원을 넘어서 해당 저널에 적합한 중요한 새로운 과학적 발견을 보고하는 한, 사전 데이터 디스크립터 출간이 새로 투고한 원고의 참신성을 손상하지 않는 것으로 간주합니다. 이 정책은 새로운 데이터셋 또는 자원을 설명하는 것을 주 목적으로 하는 후속 저널 논문으로는 확장되지 않습니다. 출판사마다 적용되는 정책은 다를 수 있으며, 저자가 해당 저널의 편집자와 상의하여 데이터 디스크립터의 사전 출간이 허용되는지 확인하는 것을 권장합니다.

자세한 내용은 편집 정책을 참조하십시오.

데이터 디스크립터는 기존의 출판물과 관련이 없는 독립형 데이터셋을 설명하는 데 사용할 수 있으며, 또한 더 큰 규모의 데이터(예: 컨소시엄에서 수집한 데이터)의 일부를 설명하는 데 사용할 수 있습니다.

아니오. 사이언티픽 데이터는 규모 및 복잡성과 관계 없이 광범위하고 기술적으로 충실한 연구 데이터셋을 출판하는 포용적인 저널을 목표로 합니다. 크거나 작은 단일 연구 또는 개별 실험실에서 생성된 데이터셋에 대한 설명을 모두 고려합니다. 또한 저명한 연구 및 논문과 관련된 데이터셋 및 범주가 넓은 데이터셋도 고려합니다. 자세한 내용은 블로그에서 확인할 수 있습니다.

사이언티픽 데이터는 연구 데이터를 게재하지 않습니다. 다만 커뮤니티에 알려져 있고 특정 데이터 유형이나, 모델 유기체, 또는 표현형을 위해 설계된 다양한 저장소 및 figshare, Dryad 디지털 저장소와 같은 전문적인 저장소와도 협력합니다. 데이터 접근을 용이하게 하기 위하여 데이터 기록이 데이터 디스크립터 내에서 링크됩니다. 데이터 보관 정책연관 블로그 포스트에서 자세한 내용을 확인하여 주시기 바랍니다.

사이언티픽 데이터는 상이한 기술 및 데이터 유형 전반에 걸쳐서 연구 데이터에 대한 표준화된(메타데이터) 설명을 제공함으로써 공공 저장소의 기존 데이터 기록을 보완하도록 설계되었습니다. 또한 해당 저널의 데이터 디스크립터는 과학자들이 상세한 ‘방법 및 기술 인증 섹션’과 사용법 정보를 포함하여 공개적으로 아카이브된 데이터셋을 더 잘 평가하고 재사용할 수 있도록 돕기 위한 정보도 포함하고 있습니다. 또한 데이터 디스크립터는 유의미한 데이터셋을 완전하고 재사용 가능한 형태로 공유하는 저자에게 출간 크레딧을 제공할 수 있습니다.

사이언티픽 데이터는 현재 생명, 의생명과학, 환경 및 사회 과학에 걸쳐 약 90여 개의 저장소를 추천하고 있습니다. 이 저장소 목록은 완전하지 않으며, 당사는 저장소 대표자 및 과학자 커뮤니티가 이 주제에 관심을 가지기를 촉구하고 있습니다.

신뢰할 수 있는 데이터 저장소는 다음과 같아야 합니다.

  • 과학자 커뮤니티 내에서 폭넓은 지지와 인정을 받아야 합니다
  • 데이터셋을 출간된 형태로 장기간 보존할 것을 보장해야 합니다
  • 전문가 큐레이션을 제공해야 합니다
  • 커뮤니티에서 지지하며 연관이 있는 보고 요구사항을 구현해야 합니다
  • 투고된 데이터셋에 대한 신뢰할 수 있는 리뷰를 제공해야 합니다
  • 투고된 데이터셋에 대한 안정적인 식별자를 제공해야 합니다
  • 불필요한 제한 없이 데이터에 대한 공개적 접근을 허용해야 합니다

저자의 개인 웹사이트를 통한 공유로는 이 요구사항을 충족할 수 없음을 알려드립니다. 저자는 개인 웹페이지 또는 위에 제시된 표준을 충족하지 않는 저장소를 통해 자유롭게 데이터를 공유할 수 있지만, 데이터 디스크립터에 투고하기 전에 일반 저장소에 데이터를 아카이빙하여 이러한 기록을 보완할 것을 요청합니다.

자세한 사항은 데이터 보관 정책추천 데이터 저장소 목록을 확인하여 주시기 바랍니다.

데이터 아카이빙을 위해 가용할 커뮤니티 저장소가 없는 경우, figshare 또는 Dryad 디지털 저장소를 사용하실 수 있습니다. 이들은 모두 데이터 파일을 호스트하고 지속성 및 보존에 관한 당사의 기준을 충족하는 일반-과학 저장소입니다. 논문 처리 비용(APC)으로 figshare에서 100GB의 저장 용량을 사용할 수 있습니다(데이터는 내부 통합 시스템을 통해 업로드되어야 하며, 여기서 상세 안내를 확인하십시오).

데이터 디스크립터 공개 시 연구 데이터의 전체 공개는 의무 사항입니다. 리뷰 과정에서 심사위원이 데이터셋에 접근할 수 있어야 하며, 이 기간 동안에는 데이터를 엠바고 상태로 유지할 수 있습니다.

더 자세한 정보는 저자 안내 페이지에서 확인할 수 있습니다.