aosus.org

توزيعة DAT Linux مثالية لعلوم البيانات 📦

اسم التوزيعة DAT Linux
نوع النظام جنو / لينكس
التوزيعة مبنية على أساس Ubuntu LTS
معمارية التوزيعة x86_64
بلد منشاء التوزيعة =====
نوع سطح المكتب LXQt
فئة التوزيعة للصيانة
حالة التوزيعة نشطة

فى هذا الموضوع سوف نقوم بمراجعة الإصدار التجريبي الأول من DAT Linux، المصمم خصيصًا لعلماء البيانات.

هناك طلب كبير على علم البيانات اليوم، بما في ذلك فرص العمل والتعلم والدورات الجامعية وما إلى ذلك. إنه تيار يتعامل مع استخلاص استنتاجات ذات معنى من خلال تطبيق الخوارزميات ونماذج الذكاء الاصطناعي.

تتوفر معظم منتجات علوم البيانات التجارية اليوم من كبار اللاعبين في مجال التكنولوجيا. وتستهدف هذه المنتجات المؤسسات الكبيرة ذات الأعمال الحيوية.

لكن المئات من الأدوات والحزم والبرامج المجانية والمفتوحة المصدر متاحة للعمل في علم البيانات والتي لا يعرفها الكثيرون.

ومن ثم، فإن إعداد نظام Linux فعال بهذه الأدوات اللازمة لعمل علم البيانات يستغرق وقتًا طويلاً لأنه يتطلب القليل من البحث والتنزيل والتثبيت وما إلى ذلك.

مع أخذ ذلك في الاعتبار، تقدم توزيعة DAT Linux مجموعة كبيرة من الأدوات والبرامج المثبتة مسبقًا والمكونة مسبقًا مع أدواته الأصلية لمساعدة علماء البيانات والطلاب والمدرسين والهواة.

■ مقدمة
DAT Linux هى توزيعة Linux متخصصه فى علم البيانات وتحتوى التوزيعة على جميع أدوات وتطبيقات علوم البيانات مفتوحة المصدر المفضلة لديك في بيئة سطح مكتب جاهزة للتشغيل.

توزيعة DAT Linux هى مبنيه على توزيعة Ubuntu 22.04، لذا فهى تعتبر سهلة التثبيت والاستخدام. وتوفر لوحة تحكم DAT Linux المخصصة مركزًا شاملاً لتشغيل وإدارة العشرات من برامج علوم البيانات.

في هذه المقالة، نستعرض DAT Linux وإصداره التجريبي.


■ مراجعة دات لينكس
● القاعدة والتصيب
الاسم “DAT” هو نسخة مجردة من كلمة “DATA”. وبما أن هدفها هو علم البيانات، فقد أصبح اسم التوزيعة هو “DAT Linux” كاختصار.

يعتمد DAT Linux في جوهره على Ubuntu LTS، أي Lubuntu 22.04 LTS اعتبارًا من إصداره 1.0b (بيتا)، وهو الإصدار المستهدف من هذه المراجعة.

يعد اختيار Lubuntu مع سطح المكتب LXQt أمرًا مثيرًا للاهتمام، ربما يكون الأداء هو الهدف من عمل علم البيانات الذي قد يتطلب موارد نظام كبيرة. ويعتبر سطح المكتب LXQt هو بيئة سطح المكتب الأكثر خفة الوزن اليوم.

التوزيعة تاتى بحجم 3.3 جيجابايت، وهو مطابق تقريبًا لـ Ubuntu 22.04 LTS. ومع ذلك، هناك اختلاف طفيف في المثبت.

تستخدم توزيعة DAT Linux مثبت Calamares المخصص بدلاً من مثبت Ubiquity من Ubuntu. والسبب فى ذلك، هو ان المثبت Calamares هو أفضل برنامج تثبيت متاح اليوم من حيث سهولة الاستخدام والاستقرار.

■ النظرة الأولى وسطح المكتب
تعتبر توزيعة Lubuntu خفيفة الوزن للغاية بفضل سطح المكتب LXQt ومكوناته. ويقدم سطح المكتب LXQt العديد من التطبيقات الأصلية مثل QTerminal، وPCManFM-QT file manager.

علاوة على ذلك، فإنك لا تهتم كثيرًا بموضوعات ومظهر سطح المكتب عند العمل في مشاريع علوم البيانات الجادة.

يعد سطح المكتب LXQt في DAT Linux بمثابة تجربة رائعة حيث يحتوي على قائمة التطبيقات على اليسار، وقائمة بالتطبيقات والنوافذ المفتوحة في المنتصف، وعلبة النظام على اليمين.

افتراضيًا، يقدم LXQt أربع مساحات عمل أعتقد أنها أكثر من كافية للتعمق بشكل منطقي في تطبيقات علوم البيانات الخاصة بك للعمل.

بشكل عام، إنه سطح مكتب سريع ونظيف ومثالي للعمل أو المشاريع.

■ الفرق مع لوبونتو
تختلف التطبيقات الافتراضية الموجودة على توزيعة DAT Linux عن التطبيقات الافتراضيه الموجودة على توزيعة إصدار Lubuntu الأصلي.

أولاً، متصفح الويب الافتراضي هو LibreWolf (وليس Firefox)، وهو متصفح مجاني ومفتوح المصدر يركز على الخصوصية.
ثانيًا، لتثبيت تطبيقات وحزم إضافية، فإنه يجلب package manager by KDE، وهى أداة مركزية لتثبيت البرامج والحزم وإزالتها وإدارتها.
بالإضافة إلى ذلك، يقدم DAT Linux أيضًا مدير حزم The Muon package manager ويعد مدير حزم Muon أيضًا مدير حزم قويًا للبحث عن الحزم وتثبيتها. بالإضافة إلى ذلك، يمكنك بسهولة إدارة مصادر البرامج وPPAs باستخدام Muon.


وتاتى توزيعة DAT Linux مع البرامج الإضافية الأخرى مثلا محرر Vim ومدير دفتر الملاحظات NobleNote ومشغل الوسائط VLC وXscreensaver وPicom. أيضًا، تم تثبيت LibreOffice مسبقًا في DAT Linux.

فى توزيعة DAT Linux، لا يتم تثبيت تطبيقات Flatpak وSnap مسبقًا.

■ التطبيقات والأدوات فى توزيعة DAT Linux.
التركيز الأساسي لهذه التوزيعة ينصب على علم البيانات، لذلك تم تحميل التوزيعة بجميع التطبيقات الضرورية لهذا التخصص.

● ● ● فيما يلي قائمة التطبيقات المدعومة فى توزيعة DAT Linux:

Description App Icon
Eclipse BIRT™ is an open source reporting system for producing compelling BI reports BiRT
ClickHouse is an open-source column-oriented DBMS for online analytical processing ClickHouse
Data Quality toolkit that allows you to profile, correct, and enrich your data Data Cleaner
Datasette is a tool for exploring and publishing data visually and with SQL Datasette
DB Browser for SQLite is a visual, open source tool to create, design, and edit database files compatible with SQLite DB Browser
Free multi-platform database tool for developers, database administrators, analysts and all people who need to work with databases DBeaver
Apache Druid is a real-time database to power modern analytics applications Druid
Convenient interface to the “webtools” R package to search for datasets in –all– CRAN packages D-Search
DuckDB is an in-process SQL OLAP database management system333 DuckDB
EGit is an Eclipse based GUI for the Git version control system E-Git
Emacs Speaks Statistics (ESS) is an add-on package for GNU Emacs to interact with statistical analysis programs such as R, S-Plus, SAS, Stata and OpenBUGS/JAGS Emacs+ESS
Gephi is the leading visualization and exploration software for all kinds of graphs and networks Gephi
Glue is a UI and Python library to explore relationships within and among related datasets Glue-viz
Gnumeric is a spreadsheet program that is part of the GNOME Free Software Desktop Project Gnumeric
gnuplot is a command-line and GUI program that can generate two- and three-dimensional plots of functions, data, and data fits GNU Plot
Grafana is a popular open-source platform for data visualization and monitoring Grafana
A GUI wraper for the Vim screen-based text editor program, with plugins for R installed G-Vim
A command shell for interactive computing with a convenient console launcher IPython
Julia is a high-level, high-performance, dynamic programming language Julia
The Jupyter Notebook is a web-based interactive, scientific computing platform Jupyter Notebook
JupyterLab is the latest web-based interactive development environment for notebooks, code, and data Jupyter Lab
KNIME Analytics Platform is open source software for data science KNIME
Free, open source and cross-platform Data Visualization and Analysis software accessible to everyone LabPlot
LibreOffice Calc is the spreadsheet component of the LibreOffice software package LibreOffice Calc
Luigi provides a framework to develop and manage data processing pipelines Luigi
Meld is a visual file diff and merge tool Meld
Metabase is an open-source business intelligence tool Metabase
MOA is an open source framework for Big Data stream mining. It includes a collection of machine learning algorithms MOA
OpenRefine is an open-source desktop application for data cleanup and transformation to other formats OpenRefine
Orange is a powerful platform to perform data analysis and visualization Orange
ParaView is an open-source, multi-platform data analysis and visualization application Paraview
notebook Pluto
the proprietary program SPSS PSPP
QGIS is a Free and Open Source Geographic Information System QGIS
Quarto® is an open-source scientific and technical publishing system built on Pandoc Quarto
R is a free software environment for statistical computing and graphics R
RStudio is an Integrated Development Environment (IDE) for R R-Studio
Scilab is a free and open-source, cross-platform numerical computational package and a high-level, numerically oriented programming language Scilab
Spyder is a free and open source scientific environment written in Python, for Python, and designed by and for scientists, engineers and data analysts Spyder
Apache Superset is a modern, enterprise-ready business intelligence web application Superset
Tabula is a free tool for extracting data from PDF files into CSV and Excel files Tabula
Veusz is a scientific plotting and graphing program with a graphical user interface, designed to produce publication-ready 2D and 3D plots Veusz
Visidata is an interactive multitool for tabular data. It combines the clarity of a spreadsheet, the efficiency of the terminal, and the power of Python, which can handle millions of rows with ease Visidata
VSCodium is a community-driven, freely-licensed binary distribution of Microsoft’s editor VS Code (ready with plugins for R/RMarkdown, Python/Jupyter, Julia) VSCodium
Weka is a GUI and collection of machine learning algorithms for data mining tasks Weka
wxMaxima is a document based interface for the computer algebra system Maxima WxMaxima
Web-based notebook that enables data-driven, interactive data analytics and collaborative documents with SQL, Scala, Python, R and more Zeppelin

كما تشاهدون، يجب أن تكون القائمة أعلاه كافية لأي حالات استخدام لعلم البيانات، سواء كنت طالبًا أو مدرسًا أو مستقلاً أو محترفًا.


■ لوحة التحكم فى توزيعة DAT Linux
فكر فريق تطوير توزيعة DAT Linux أيضًا في طريقة مناسبة للعثور على هذه التطبيقات الإضافية وتشغيلها.

للقيام بذلك، فإنه يجلب لوحة تحكم DAT Linux، وهو مشغل تطبيقات قائم على الشبكة لتطبيقات علوم البيانات مصنفة حسب الوظائف في علامات تبويب منفصلة.

كما أنه يوفر لك العديد من الخيارات الإضافية لتطبيقات DAT Linux الأصلية مثل تحديث البرامج، والمراجع الخاصة بلغة البرمجة، وما إلى ذلك.


أخيرًا، ياتى مع هذا الإصدار Linux Kernel 5.15 LTS مع Python 3.10 وLXQt 0.17 – وهو الأساس فة توزيعة Ubuntu 22.04 LTS.

■ أداء التوزيعة
مقياس أداء التوزيعة مثير للإعجاب. في حالة الخمول، يستخدم DAT Linux ما بين 500 ميجابايت إلى 700 ميجابايت من ذاكرة الوصول العشوائي (RAM)، وتكون وحدة المعالجة المركزية (CPU) في المتوسط ​​4٪.
والملاحظ انه يتم استهلاك معظم موارد النظام بواسطة خدمات Systemd.

من الواضح أن المقياس يرتفع عند تشغيل العديد من تطبيقات ومتصفحات علوم البيانات.

ومن الضروري أيضًا أن نتذكر أن معظم أعمال علم البيانات تتطلب قوة حاسوبية كبيرة. ومن ثم، فمن الأفضل دائمًا استخدام هذه التوزيعة على الأجهزة الحديثة المزودة بأحدث عائلات وحدة المعالجة المركزية.


بالإضافة إلى ما سبق، تأخذ DAT Linux حوالي 10 جيجابايت من مساحة القرص للتثبيت الافتراضي وتثبيت جميع الحزم.

■ الخلاصة
على الرغم من وجود الآلاف من التوزيعات ، فإن DAT Linux فريد من نوعها لأنها مزيج من Lubuntu LTS مع حزم Data Science فقط.

وفقًا لمعلوماتي البسيطة، فإن توزيعة Fedora هي الوحيدة التي لديها نسخة تسمى “Fedora Scientific”، والتي تتعامل بشكل أساسي مع البرامج العلمية.

ومع ذلك، كان أداء DAT Linux جيدًا من خلال تجميع جميع التطبيقات الضرورية بواجهة أمامية لإدارتها.

أحد الجوانب الرئيسية هو أن هذا التوزيعة ستوفر الوقت من تثبيت وتكوين كل هذه التطبيقات بواسطة مستخدم عام.

كما تعد قاعدة Ubuntu LTS مع سطح المكتب LXQt خيارًا مناسبًا. بخلاف ذلك، فهي توزيعة كاملة وتعمل بشكل جيد. آمل أن نخرج من النسخة التجريبية قريبًا وأن نحصل على أول إصدار مستقر.

 

DAT Linux | Distribution for Data Science

DAT Linux 1.0.1 (Install and Overview)

DAT Linux : Perfect Linux distro for DATA SCIENCE

DAT Linux The Data Science OS

 

Aosus

عن GNU/ Linux SA

احاول من خلال مدونتي البسيطة نشر مبادئ حركة البرمجيات الحرة والتى هدفها ضمان الحريات الأربع الأساسية لمستخدمي البرمجيات: حرية تشغيل البرمجيات, دراستها وتغييرها, وتوزيع نسخ منها مع تعديلات أو بدون تعديلات. ,ونشر فلسفة الحركة هي إعطاء مستخدمي الحاسوب الحرية عن طريق استبدال البرمجيات الاحتكارية بالبرمجيات الحرة, مع الهدف الأساسي المتمثل في تحرير الجميع إلى "الفضاء الإالكتروني" لكل مستخدمي الحاسوب.